Idee operative MNQZ2024
REGRESSIONE LINEARE COS'E' e come utilizzarlaPer questo articolo è necessario partire da alcune assunzioni matematico statistico ed econometriche.
Cos'è e come si calcola la regressione lineare e il canale di regressione.
Il modello di regressione lineare semplice postula l'esistenza di una relazione lineare tra una variabile dipendente, Y, e una singola variabile indipendente, X. Nel contesto dell'analisi tecnica, la variabile dipendente Y è tipicamente il prezzo di un asset finanziario, mentre la variabile indipendente X rappresenta il tempo (ad esempio, una sequenza di interi che indicizzano i periodi: 1, 2, 3,..., n). Il modello è formalizzato dalla seguente equazione:
Yi=β0+β1Xi+ϵi
dove:
Yi è il valore osservato della variabile dipendente (prezzo) al tempo i.
Xi è il valore della variabile indipendente (tempo) all'istante i.
β0 è l'intercetta, ovvero il valore teorico di Y quando X=0.
β1 è il coefficiente angolare, o pendenza, che misura la variazione media di Y per un incremento unitario di X. Nel trading, questo parametro è di importanza cruciale, poiché il suo segno e la sua magnitudine quantificano la direzione e la forza del trend lineare.2
ϵi è il termine di errore stocastico (o residuo), che rappresenta la differenza tra il valore osservato Yi e il valore previsto dalla componente lineare del modello. Questo termine cattura tutti i fattori non spiegati dalla relazione lineare, inclusa la casualità intrinseca dei movimenti di prezzo.
Dopo di che è necessario introdurre il metodo dei minimi quadrati
Poiché i parametri β0 e β1 della popolazione sono incogniti, devono essere stimati a partire da un campione di dati osservati. Il metodo più comune per ottenere tali stime, indicate come b0 e b1, è il Metodo dei Minimi Quadrati Ordinari (OLS). Il principio fondamentale dell'OLS è quello di identificare l'unica retta, definita "linea di migliore adattamento" (best-fit line), che minimizza la somma dei quadrati delle differenze verticali tra i valori dei prezzi effettivamente osservati (yi) e i valori previsti dal modello (y^i=b0+b1xi).
Matematicamente, si tratta di trovare i valori di b0 e b1 che minimizzano la Somma dei Quadrati dei Residui (Sq):
Sq=i=1∑n(yi−y^i)2=i=1∑n(yi−b0−b1xi)2
Questo problema di minimizzazione viene risolto analiticamente calcolando le derivate parziali prime della funzione Sq rispetto a b0 e b1 e ponendole uguali a zero. La soluzione di questo sistema di equazioni fornisce le formule per le stime dei parametri.
Adesso si deve procedere con la Formulazione e Calcolo dei Parametri di Regressione
Le soluzioni del problema dei minimi quadrati forniscono espressioni esplicite per il calcolo dei coefficienti di regressione.
Coefficiente Angolare (Pendenza, b1): La pendenza della retta di regressione è data dal rapporto tra la covarianza campionaria di X e Y e la varianza campionaria di X. In termini operativi, si utilizzano i concetti di devianza e codevianza 8:
b1=∑i=1n(xi−μX)2∑i=1n(xi−μX)(yi−μY)=DXCXY
dove CXY è la codevianza di X e Y, e DX è la devianza di X. Un valore b1>0 indica un trend rialzista, b1<0 un trend ribassista, e b1≈0 un mercato laterale o privo di trend lineare.3
Intercetta (b0): L'intercetta è calcolata in modo da garantire che la retta di regressione passi per il baricentro (μX,μY) del campione di dati 8:
b0=μY−b1μX
Deviazione Standard dei Residui (σ^): Questa misura, nota anche come Errore Standard della Regressione, quantifica la dispersione media dei punti di dati attorno alla retta di regressione. È la stima della deviazione standard del termine di errore ϵ e costituisce la base fondamentale per la costruzione delle bande del canale di regressione. Si calcola come la radice quadrata della varianza dei residui, corretta per i gradi di libertà (n−k, dove n è il numero di osservazioni e k è il numero di parametri stimati, 2 nel caso della regressione semplice) 9:
σ^=n−2∑i=1n(yi−y^i)2
È importante sottolineare che la regressione lineare, nel contesto del trading, non stabilisce una relazione di causalità. Il tempo (X) non "causa" il prezzo (Y). Il modello si limita a descrivere la correlazione statistica storica tra le due variabili, fornendo una sintesi lineare della traiettoria dei prezzi in un dato intervallo.9 Confondere questa correlazione con una relazione causale può portare a un'eccessiva fiducia nel potere predittivo del modello, che in realtà sta semplicemente estrapolando una tendenza passata.
Sarà poi necessario misurare la bontà dell'adattamento questo si fa con R2
L'affidabilità delle stime OLS e delle inferenze statistiche che ne derivano dipende dalla validità di una serie di assunzioni sul termine di errore ϵi 9:
Linearità nei parametri: Il modello deve essere una funzione lineare dei parametri β0 e β1.
Media condizionale nulla degli errori: E(ϵi∣Xi)=0. In media, gli errori si annullano.
Omoschedasticità: La varianza degli errori è costante per tutti i livelli di X, ovvero Var(ϵi∣Xi)=σ2.
Assenza di autocorrelazione: Gli errori associati a osservazioni diverse non sono correlati tra loro, Cov(ϵi,ϵj)=0 per i=j.
Normalità degli errori: Gli errori sono distribuiti secondo una distribuzione normale con media zero e varianza costante, ϵi∼N(0,σ2).
la violazione delle assunzioni di omoschedasticità, assenza di autocorrelazione e normalità è la norma, non l'eccezione, nei mercati finanziari. Questa discrepanza tra teoria e realtà costituisce la principale debolezza del modello e la fonte di molti segnali di trading inaffidabili.
LA distribuzione normale
La distribuzione normale, o gaussiana, è una distribuzione di probabilità continua caratterizzata dalla sua distintiva forma a campana, simmetrica attorno al suo valore centrale. Le sue proprietà principali sono che media, mediana e moda coincidono.19 Questa distribuzione è completamente definita da due soli parametri:
La Media (μ): che determina la posizione del centro della curva sull'asse orizzontale.
La Deviazione Standard (σ): che misura la dispersione o la "larghezza" della curva. Una deviazione standard maggiore indica una maggiore variabilità dei dati e una curva più piatta e larga; una deviazione standard minore indica dati più concentrati attorno alla media e una curva più alta e stretta.
La Regola Empirica 68-95-99.7
Per qualsiasi variabile che segue una distribuzione normale, esiste una relazione fissa tra la deviazione standard e la percentuale di dati che si trovano entro una certa distanza dalla media. Questa relazione è nota come la Regola Empirica, o regola 68-95-99.7
Circa il 68% delle osservazioni si trova entro una deviazione standard dalla media (nell'intervallo ).
Circa il 95% delle osservazioni si trova entro due deviazioni standard dalla media (nell'intervallo ).
Circa il 99.7% delle osservazioni si trova entro tre deviazioni standard dalla media (nell'intervallo ).
Queste percentuali derivano matematicamente dall'integrazione della funzione di densità di probabilità della distribuzione normale.
La costruzione del canale di regressione
Il canale di regressione traduce questi concetti statistici in uno strumento visivo per l'analisi dei grafici di prezzo. È composto da tre linee:
Linea Centrale: È la retta di regressione lineare ($ \hat{y}_i = b_0 + b_1 x_i $) calcolata come descritto nella Sezione 1. Questa linea rappresenta la stima del valore medio o di equilibrio dei prezzi per il periodo analizzato.
Banda Superiore: È una linea parallela alla retta di regressione, tracciata a una distanza di +2 volte l'errore standard della regressione (σ^). La sua equazione è: Banda Superiore=y^i+2σ^.
Banda Inferiore: È una linea parallela alla retta di regressione, tracciata a una distanza di -2 volte l'errore standard della regressione (σ^). La sua equazione è: Banda Inferiore=y^i−2σ^.4
L'interpretazione statistica di questo canale è che esso rappresenta un intervallo di confidenza del 95% attorno alla linea di tendenza. Se l'assunzione di normalità dei residui fosse valida, ci si aspetterebbe che il 95% dei prezzi osservati si collochi all'interno di questo canale. Di conseguenza, un prezzo che si muove al di fuori delle bande è considerato un evento statisticamente raro (con una probabilità teorica del 5%), segnalando una potenziale condizione di ipercomprato (sopra la banda superiore) o ipervenduto (sotto la banda inferiore).15
Tuttavia, è fondamentale comprendere che l'applicazione diretta della regola empirica ai prezzi finanziari rappresenta un'approssimazione concettualmente imperfetta. La regola è valida per distribuzioni stazionarie (come la normale), mentre le serie storiche dei prezzi sono intrinsecamente non stazionarie, con media e varianza che evolvono nel tempo.
Pertanto, la probabilità reale che un prezzo rimanga all'interno del canale non è garantita essere esattamente del 95%. La vera utilità del canale non risiede nella sua precisione probabilistica, ma nella sua capacità di fornire una misura
dinamica e normalizzata della volatilità attorno a un trend locale. I prezzi che toccano le bande non dovrebbero essere interpretati come "eventi con probabilità del 5%", ma piuttosto come prezzi che hanno raggiunto un livello di deviazione estremo rispetto al comportamento recente del mercato. Questa reinterpretazione sposta il focus del canale da uno strumento predittivo-probabilistico a uno strumento descrittivo-adattivo della volatilità, un punto cruciale per il suo uso corretto nel trading.
Perché da solo NON BASTA?
1)L'Assunzione di Linearità vs. la Realtà dei Mercati
2)La Non-Stazionarietà delle Serie Storiche Finanziarie
3)La Non-Normalità dei Rendimenti: Il Problema delle "Code Grasse" (Fat Tails):
-Asimmetria
-Leptocurtosi
Quindi è inutile?
Assolutamente no, c'è la possibilità di utilizzare tale strumento come base per la costrustione di strategie più complesse, da solo non basta.
Quindi come ovviare a questi problemi?
Soluzione alla Non-Stazionarietà :
1)La pratica econometrica standard per affrontare la non-stazionarietà dei prezzi consiste nel trasformare la serie. Invece di modellare i prezzi, si modellano i rendimenti (spesso i rendimenti logaritmici, calcolati come rt=ln(Pt/Pt−1)). I rendimenti sono generalmente più vicini a un processo stazionario, rendendo i modelli statistici applicati su di essi più affidabili e meno soggetti a regressioni spurie.
2) Rolling Regression : Invece di calcolare una singola retta di regressione su tutto il set di dati, la rolling regression (o regressione mobile) calcola la regressione su una finestra di dati di lunghezza fissa che si sposta in avanti nel tempo (ad esempio, gli ultimi 100 periodi). Questo approccio permette ai coefficienti b0 e b1 di ricalcolarsi a ogni nuovo dato, adattandosi così ai cambiamenti nel trend e nella volatilità del mercato. La "curva" di regressione visualizzata su molte piattaforme di trading è, in effetti, la traccia dell'ultimo punto di una serie di regressioni mobili, che conferisce al modello una reattività molto maggiore.
3) Regressione Polinomiale : Per catturare le dinamiche non lineari, è possibile estendere il modello lineare includendo termini di grado superiore della variabile tempo (ad esempio, X2,X3). Un modello di regressione polinomiale, come Y=β0+β1X+β2X2+ϵ, può descrivere trend curvi, catturando fasi di accelerazione o decelerazione. Sebbene la relazione tra Y e X sia non lineare, il modello rimane lineare nei parametri e può essere stimato con OLS. Questo offre un modo semplice per andare oltre la rigidità di una linea retta.
Affrontare la Non-Normalità e i Falsi Segnali: Indicatori di Conferma
Per filtrare i numerosi falsi segnali generati dalle violazioni delle assunzioni statistiche (in particolare le fat tails), è fondamentale applicare il principio di confluenza: un segnale di trading è considerato più robusto se è confermato simultaneamente da più indicatori basati su logiche diverse.
Ad esempio sto utilizzando un canale di regressione come filtro, se il canale ha tendenza crescente, valuterò solo entrate long, se si trova sotto la linea centrale, e con l'auto del footprint volume e del delta, cercherò degli stacked imbalace long e candele con delta fortemente positivo. Ma può essere usato lo stocastico, l'RSI, le medie mobili ecc.
Detto ciò in conclusione
I risultati principali possono essere così sintetizzati:
Fondamento Statistico: Il canale di regressione è uno strumento statisticamente ricco, che quantifica il trend (tramite la pendenza della retta) e la volatilità attorno ad esso (tramite l'ampiezza del canale). La sua costruzione si basa su principi solidi come il metodo dei minimi quadrati e le proprietà della distribuzione normale.
Limiti Strutturali: Le assunzioni fondamentali del modello – linearità, stazionarietà e normalità dei residui – sono profondamente e sistematicamente violate dai dati finanziari. I mercati sono non lineari, le serie dei prezzi non sono stazionarie e i rendimenti presentano "code grasse". Queste violazioni portano a regressioni spurie, a una costante sottostima del rischio e alla generazione di numerosi segnali di trading inaffidabili.
Valutazione Finale: Di conseguenza, il canale di regressione lineare non deve essere considerato uno strumento predittivo autonomo o una "scatola nera" in grado di generare profitti meccanicamente. La sua vera utilità risiede nel suo ruolo di indicatore descrittivo del trend e della volatilità passati e recenti. Fornisce un contesto quantitativo, non una previsione certa.
La prospettiva futura per un utilizzo efficace di questo strumento non risiede nel suo abbandono, ma nella sua intelligente integrazione all'interno di un sistema di trading multi-fattoriale e adattivo. Come dimostrato, l'impiego di tecniche come la rolling regression, l'uso di indicatori di conferma, filtri di trend come le medie mobili a lungo termine, può mitigare significativamente le sue debolezze. In questo approccio evoluto, il canale di regressione non è più il fulcro della strategia, ma una componente che fornisce informazioni sul posizionamento relativo del prezzo all'interno di un framework decisionale più ampio e robusto. Questo percorso, che va dalla semplice applicazione di un modello alla comprensione critica e all'integrazione contestuale, rappresenta la transizione essenziale da un'analisi tecnica rudimentale a un approccio al trading genuinamente quantitativo.
Spero che l'argomento non sia stato troppo ostico, e spero di aver dato spunto a qualcuno per costruirci una strategia magari migliore della mia.
BUON TREDING A TUTTI
Test Chiave per il Trend del NASDAQL'analisi del Future sul NASDAQ si rivela un contesto operativo caratterizzato da una chiara direzionalità di fondo, sebbene attraversato da una fase di debolezza di breve termine. La struttura primaria del mercato è inequivocabilmente rialzista, come validamente descritto dal canale di regressione lineare ascendente. I prezzi si sono mossi con regolarità all'interno delle due deviazioni standard, indicando un trend sano e non eccessivamente volatile. Recentemente, il mercato ha testato la parte superiore del canale, corrispondente alla seconda deviazione standard, per poi avviare una fase di ritracciamento correttivo che ha riportato le quotazioni nella metà inferiore del canale stesso, al di sotto della linea di regressione centrale. Quest'ultima, da supporto dinamico, agisce ora come prima resistenza. Al momento della stesura, il prezzo di 23.344,75 si trova al di sotto del Pivot Point calcolato con metodo Fibonacci, posto a 23.545,75, un ulteriore segnale che conferma la pressione ribassista nel breve periodo. I livelli di supporto più vicini, e quindi potenziali aree di interesse per posizioni lunghe, si identificano nel primo supporto (S1) a 23.380,50, attualmente sotto pressione, e successivamente nel secondo supporto (S2) a 23.278,50. Un'eventuale tenuta di quest'area, in particolare della zona tra S1 e S2, potrebbe offrire un'opportunità di acquisto in linea con il trend primario. Un segnale di conferma per un'entrata long verrebbe dall'oscillatore Stocastico, che al momento naviga nella parte inferiore della sua scala senza però aver ancora raggiunto la zona di ipervenduto; un incrocio al rialzo delle sue linee in prossimità di tale area di supporto costituirebbe un elemento di forza. Inoltre, il Momentum, attualmente negativo e al di sotto della linea dello zero, dovrebbe mostrare un'inversione e tornare in territorio positivo per validare la ripresa della spinta rialzista. La volatilità, misurata da un ATR a 317.61, suggerisce di calibrare adeguatamente la gestione del rischio. Per quanto riguarda le possibili operazioni short, esse si configurerebbero come operazioni di natura tattica e contrarian rispetto al trend principale. Un'opportunità in tal senso potrebbe materializzarsi con una chiara violazione del supporto S2 a 23.278,50. Tale rottura aprirebbe la strada a un'ulteriore discesa verso il terzo supporto (S3) a 23.113,50, con un target finale potenzialmente coincidente con la parte inferiore del canale di regressione, che rappresenta il supporto dinamico più significativo dell'intera struttura rialzista. Un'operazione short verrebbe supportata dal perdurare di un Momentum negativo e da uno Stocastico che prosegue la sua discesa. I volumi di scambio durante questa fase correttiva sono stati sostenuti, in particolare sulle candele ribassiste, indicando una certa pressione in vendita che al momento non trova ancora una decisa reazione da parte dei compratori. In sintesi, il mercato si trova in un'interessante zona di conflitto tra la solida struttura rialzista di medio termine e la debolezza correttiva di breve periodo, con i livelli pivot e i confini del canale di regressione che fungeranno da arbitri per la prossima mossa direzionale.
SCENARIO POTENZIALE PER IL FUTURES DEL NASDAQIl prezzo potrebbe continuare a scendere fino alla zona di 23.100, dove presente un SMT a bassa resistenza (considerati quali target del prezzo). qui potremmo pensare di entrare con una trade long essendo in zona discount del macro swing di riferimento (come può essere facilmente ravvisabile dalla lettura del grafico). Ulteriormente, a maggior sostegno di tale tesi, la presenza dell OB1 e OB2.