A (ad hoc) modo semplice è quello di prendere solo una media ponderata (sintonizzabile da alpha) in ogni punto con i suoi vicini: o qualche variazione dello stesso. Sì, per essere più sofisticati di Fourier è possibile trasformare i dati, poi tagliare le alte frequenze. Qualcosa di simile a: Questo taglia fuori i più alti 20 frequenze. Fare attenzione a tagliarli fuori simmetricamente altrimenti la trasformazione inversa non è più vero. È necessario scegliere con attenzione la frequenza di taglio per il giusto livello di lisciatura. Questo è molto semplice tipo di filtro (filtraggio scatola nel dominio della frequenza), in modo da poter provare attenuanti delicatamente frequenze di ordine superiore se la distorsione è inaccettabile. risponde 4 9 ottobre alle 9:16 FFT è neanche una cattiva idea, ma la sua probabilmente eccessivo qui. In esecuzione o medie mobili forniscono risultati generalmente scarsa e dovrebbe essere evitato per nulla oltre a tarda compiti a casa (e rumore bianco). uso Id filtraggio Savitzky-Golay (in Matlab sgolayfilt (.)). Questo vi darà i migliori risultati per quello che stai cercando - un po 'di smoothing locale, pur mantenendo la forma del tutorial curve. This viene illustrato come utilizzare MATLAB per l'elaborazione delle immagini. Una certa familiarità con MATLAB è assunto (si dovrebbe sapere come utilizzare matrici e scrivere un M-file). E 'utile avere il MATLAB Image Processing Toolbox, ma per fortuna, non sono necessarie cassette per la maggior parte delle operazioni. I comandi che richiedono la Toolbox immagine sono indicati con Toolbox immagine. Rappresentazione Immagine Ci sono cinque tipi di immagini in MATLAB. Scala di grigi. In scala di grigio M pixel di altezza e N pixel di larghezza è rappresentato come una matrice di doppio tipo di dati di taglia M N. valori degli elementi (ad esempio MyImage (m, n)) denotano il pixel intensità scala di grigi a 0,1 con 0black e 1white. TrueColor RGB. Un'immagine TrueColor rosso-verde-blu (RGB) è rappresentato come un tridimensionale M N 3 doppia matrice. Ogni pixel ha rosso, verde, blu componenti lungo la terza dimensione con valori di 0,1, per esempio, i componenti di colore del pixel (m, n) sono MyImage (m, n, 1) rosso, MyImage (m, n, 2) verde, MyImage (m, n, 3) blue. Indexed. Indicizzate immagini (tavolozza) sono rappresentati con una matrice di indice di taglia M N e una matrice colormap di dimensioni K 3. La mappa di colori contiene tutti i colori utilizzati nell'immagine e la matrice indice rappresenta i pixel facendo riferimento ai colori nella mappa di colori. Ad esempio, se il colore 22 è magenta MyColormap (22, :) 1,0,1. poi MyImage (m, n) 22 è un pixel. Binary color magenta. Una immagine binaria è rappresentata da una matrice logica M N dove i valori dei pixel sono 1 (vero) o 0 (false).uint8. Questo tipo utilizza meno memoria e alcune operazioni di calcolare più velocemente che con doppio tipi. Per semplicità, questo tutorial non discute uint8 ulteriormente. Scala di grigi è di solito il formato preferito per l'elaborazione delle immagini. Nei casi che richiedono il colore, l'immagine a colori RGB può essere scomposto e gestita come tre immagini in scala di grigi separati. immagini indicizzate devono essere convertiti in scala di grigi o RGB per la maggior parte delle operazioni. Qui di seguito sono alcune manipolazioni e conversioni comuni. Alcuni comandi richiedono la Casella degli strumenti Immagine e sono indicati con Toolbox immagine. Leggere e scrivere file di immagine MATLAB può leggere e scrivere le immagini con la imread e comandi imwrite. Anche se un buon numero di formati di file sono supportati, alcuni non lo sono. Utilizzare imformats di vedere ciò che supporta l'installazione: Durante la lettura di immagini, un problema di spiacevole è che imread restituisce i dati di immagine in uint8 tipo di dati, che deve essere convertito in doppio e rescaled prima dell'uso. Così, invece di chiamare direttamente imread, io uso la seguente funzione M-file da leggere e convertire le immagini: tasto destro del mouse e salvare getimage. m Per utilizzare questa funzione M. Se l'immagine baboon. png si trova nella directory corrente (o da qualche parte nel percorso di ricerca di MATLAB), si può leggere con MyImage getImage (baboon. png). È inoltre possibile utilizzare i percorsi parziali, ad esempio, se l'immagine è in LT gtimages directory corrente con getImage (imagesbaboon. png). Per scrivere un'immagine RGB in scala di grigi o, l'uso Fare attenzione che MyImage è una doppia matrice con elementi in 0,1if impropriamente in scala, il file salvato sarà probabilmente vuota. Durante la scrittura di file di immagini, mi consiglia di utilizzare il formato di file PNG. Questo formato è una scelta affidabile dal momento che è senza perdita di dati, supporta TrueColor RGB, e comprime abbastanza bene. Utilizzare altri formati con cautela. Operazioni di base Di seguito sono elencate alcune operazioni di base in scala di grigio u via. I comandi che richiedono la Toolbox immagine sono indicati con Toolbox immagine. (Nota:. Per qualsiasi matrice, la sintassi u (:) mezzi u srotolano in un vettore colonna Ad esempio, se u 1,50,2 allora u (:) è 1052), ad esempio, potenza del segnale immagine viene utilizzata in.. calcolo segnale-rumore (SNR) e il picco rapporto segnale-rumore (PSNR). immagine pulita uclean e il rumore contaminati immagine u Dato, fare attenzione alla norma. il comportamento è norma (v) il vettore v calcola sqrt (somma (v.2)). ma norma (A) sulla matrice A calcola l'indotto L 2 norma matrice, così norma (A) non è certamente sqrt (sum (A (:). 2)). È tuttavia un errore facile da usare norma (A), dove avrebbe dovuto essere norma (A (:)). filtri lineari filtraggio lineare è la tecnica pietra angolare di elaborazione del segnale. Per introdurre brevemente, un filtro lineare è un'operazione in cui ad ogni pixel x m, n di un'immagine, una funzione lineare viene valutata sul pixel ei suoi vicini per calcolare un nuovo valore di pixel y m, n. Un filtro lineare in due dimensioni ha la forma generale dove x è l'ingresso, y è l'uscita, eh è la risposta del filtro impulso. Diverse scelte di h conducono a filtri che liscio, affinare, e rilevano bordi, solo per citarne alcune applicazioni. Il lato destro dell'equazione sopra è indicata conciso h x ed è chiamata la convoluzione di h e x. filtraggio spaziale-dominio filtraggio lineare bidimensionale è implementata in MATLAB con CONV2. Purtroppo, CONV2 può gestire solo il filtraggio in prossimità dei bordi dell'immagine per zero-padding, il che significa che i risultati di filtraggio sono generalmente inappropriato per pixel vicino al confine. Per ovviare a questo, siamo in grado di pad l'immagine in ingresso e utilizzare l'opzione valida quando si chiama CONV2. La seguente funzione M fa questo. Pulsante destro del mouse e salvare conv2padded. m Per utilizzare questa funzione M. Ecco alcuni esempi: Un filtro 2D h è detto essere separabili se può essere espresso come il prodotto esterno di due filtri 1D h1 e h2. cioè, h h1 (:) h2 (:). E 'più veloce di passare H1 e H2 di h. come è fatto sopra della media mobile finestra e il filtro gaussiano. Infatti, la Sobel filtra hx ed hy sono anche separablewhat sono h1 e h2 Fourier-dominio filtraggio spaziale-dominio filtraggio con CONV2 è facilmente un'operazione computaionally costoso. Per un filtro K K su un'immagine M N, costi CONV2 O (MNK 2) addizioni e moltiplicazioni, o O (N 4) supponendo M N K. Per grandi filtri, filtraggio nel dominio di Fourier è più veloce poiché il costo computazionale è ridotto a O (N 2 log N). Utilizzando la proprietà convoluzione-moltiplicazione della trasformata di Fourier, la convoluzione è equivalente calcolata Il risultato è equivalente a conv2padded (x, h) tranne vicino al confine, dove il sopra di calcolo utilizza l'estensione contorno periodiche. filtraggio di Fourier-based può essere fatto anche con l'estensione di confine simmetrica riflettendo l'ingresso in ogni direzione: (Nota: Un metodo ancora più efficace è FFT filtraggio sovrapposizione-add Il Signal Processing Toolbox implementa FFT sovrapposizione-aggiunge in una dimensione fftfilt. .) non lineare filtri un filtro non lineare è un'operazione in cui ogni pixel filtrato ym, n è una funzione non lineare di xm, n ei suoi vicini. Qui si discute brevemente alcuni tipi di filtri non lineari. filtri statistici ordine se avete la casella degli strumenti Immagine, filtri statistica d'ordine può essere eseguita con ordfilt2 e medfilt2. Un filtro statistica d'ordine ordina i valori dei pixel su un quartiere e seleziona il k-esima valore più grande. Il min, max, e filtri mediani sono casi speciali. filtri morfologici Se avete la casella degli strumenti Immagine, bwmorph implementa varie operazioni morfologiche sulle immagini binarie, come l'erosione, dilatazione, aprire, chiudere, e lo scheletro. Ci sono i comandi disponibili anche per la morfologia sulle immagini in scala di grigi: imerode. imdilate e imtophat. tra gli altri. Costruire il proprio filtro di tanto in tanto vogliamo utilizzare un nuovo filtro che MATLAB non ha. Il codice che segue è un modello per i filtri di attuazione. (Nota:.. L'indicazione sbagliata frequente è che i cicli di MATLAB sono lenti e devono essere evitati Questo una volta era vero, di nuovo in MATLAB 5 e precedenti, ma con passanti in versioni moderne sono ragionevolmente veloce) Ad esempio, il filtro alfa-rifilato dire ignora i d 2 bassi e D 2 valori più alti nella finestra, e le medie rimanenti (1 2 r) valori 2 d. Il filtro è un equilibrio tra un filtro mediano ed un filtro medio. Il filtro media alfa-rifilato può essere implementato nel modello come Come un altro esempio, il filtro bilaterale isGEOS 585A, Tempo Analisi Applicata Serie Telefono: (520) 621-3457 Fax: (520) 621-8229 Orario di ricevimento Venerdì, 1:00 -6: 00 PM (si prega di e-mail per programmare riunioni) del corso strumenti Descrizione analisi nel dominio del tempo e della frequenza vengono introdotti nel contesto della serie di tempo di campionamento. Io uso un set di dati di serie temporali di esempio per illustrare i metodi e modificare il set di dati ogni semestre il corso viene offerto. Quest'anno il set di dati campione proviene da un progetto NSF sulla variabilità del manto nevoso in American bacino del fiume della California. Questo set di dati comprende cronologie anelli degli alberi, indici climatici, record deflusso, e serie temporali di equivalente neve-acqua misurata presso le stazioni di neve portate. Sarà assemblare la propria serie temporali per l'utilizzo in corso. Questi potrebbero essere dal proprio progetto di ricerca. Torna ad inizio pagina Si tratta di un corso introduttivo, con enfasi su aspetti pratici di analisi di serie temporali. I metodi sono gerarchicamente introdotti - a partire con la terminologia e sperimentali grafica, di trasferirsi a statistiche descrittive, per finire con le procedure di modellazione di base. Gli argomenti includono l'eliminazione del trend, il filtraggio, la modellazione autoregressiva, analisi spettrale e la regressione. Si spendono le prime due settimane l'installazione di Matlab sul vostro computer portatile, ottenendo una introduzione al Matlab, e di montare il set di dati di serie storiche per il corso. Dodici temi, o lezioni vengono poi coperti, ciascuna con aggiudicazione di una settimana, o due ore di lezione. Dodici compiti in classe andare avanti con gli argomenti. Assegnazioni consistono in applicazione dei metodi per l'esecuzione di script Matlab pre-scritto (programmi) sulla serie storica e l'interpretazione dei risultati. Il corso 3 crediti per gli studenti del campus della University of Arizona a Tucson, e 1 credito per gli studenti on-line. Qualsiasi serie temporale con un incremento costante di tempo (ad esempio, giorno, mese, anno) è un candidato per l'uso nel corso. Esempi sono le misurazioni delle precipitazioni giornaliere, deflusso totale stagionale, estate temperatura media dell'aria, gli indici annuali di crescita degli alberi, indici di temperatura della superficie del mare, e l'incremento dell'altezza quotidiana di un arbusto. Come risultato di prendere il corso, si dovrebbe: comprendere i concetti di serie temporali di base e la terminologia in grado di selezionare i metodi di serie storiche adeguate agli obiettivi essere in grado di valutare criticamente la letteratura scientifica applicando i metodi di serie temporali coperti hanno una migliore comprensione delle proprietà delle serie temporali del vostro proprio insieme di dati in grado di riassumere in modo conciso risultati delle analisi di serie temporali per iscritto Prerequisiti una statistica corso introduttivo l'accesso a un computer portatile in grado di avere Matlab installato il permesso di istruttore (laureandi e studenti online) Altri requisiti Se siete su un dell'Università di Arizona (UA) studente nel campus a Tucson, si ha accesso a Matlab e cassette necessarie attraverso una licenza di sito UA come nessun software costo. Non è richiesta alcuna precedente esperienza con Matlab, e la programmazione di computer non è parte del corso. Se sei un on-line, non nel campus alla UA, si sarà in grado di seguire il corso nella primavera 2017 semestre come un iCourse. È necessario assicurarsi che si ha accesso a Matlab e le caselle degli strumenti necessari (vedi sotto) alla vostra posizione. L'accesso a internet. Non c'è scambio di carta in corso. Note e le assegnazioni vengono scambiati elettronicamente e le assegnazioni completati sono presentate per via elettronica attraverso la University of Arizona Desire2Learn sistema (D2L). Versione Matlab. Aggiorno script e funzioni di tanto in tanto con la versione corrente del sito-licenza di Matlab, e gli aggiornamenti potrebbero utilizzare Matlab non disponibili in precedenza Matlab rilascia. Per il 2017, sto usando Matlab versione 9.1.0.441655 (R2016b). Se si utilizza una versione precedente, assicurarsi che sia 2007b Matlab rilascio o superiore. In aggiunta al pacchetto principale Matlab, quattro caselle degli strumenti vengono utilizzati: statistiche, elaborazione del segnale, di identificazione del sistema, e sia Spline (Matlab 2010a uscita o precedente), o curve fitting (Matlab Stampa 2010b o poi) Disponibilità Il corso è offerto nella primavera del Semestre ogni due anni (2015, 2017, ecc.); E 'aperto a studenti laureati e può anche essere presa dagli anziani di laurea con il permesso dell'istruttore. L'iscrizione di studenti UA residenti è limitato a 18 per la primavera semestre 2017. Un piccolo numero di studenti online è stato anche di solito ospitati offrendo il corso in vari modi. Il modo in cui ora è il luogo iCourse sopra descritto. Torna all'inizio della pagina Struttura del corso (lezioni) Il programma permette di solito circa due settimane per la raccolta di dati e prendere familiarità con Matlab. Poi una settimana (due ore di lezione) sono dedicati a ciascuna delle 12 lezioni o argomenti. Classe incontra il Martedì e Giovedi. Un nuovo argomento viene introdotto il Martedì, ed è proseguito il seguente Giovedi. Classe di giovedì si conclude con un incarico e una dimostrazione di esecuzione dello script sui miei dati di esempio. L'assegnazione è dovuto (deve essere caricato da voi per D2L) prima classe Martedì seguente. La prima 12 ore di quella classe il martedì è utilizzato per guidare auto-valutazione e classificazione della cessione e il caricamento di valutati (graduate) le assegnazioni a D2L. I restanti 45 minuti sono utilizzati per introdurre l'argomento successivo. È necessario portare il vostro computer portatile in classe il martedì. Le 12 lezioni o argomenti trattati nel corso sono elencati nella struttura di classe. studenti online sono tenuti a seguire lo stesso programma di presentare le assegnazioni come gli studenti fuori sede, ma non hanno accesso alle lezioni. assegnazioni presentate di studenti online non sono auto-valutati, ma sono classificati da me. studenti online devono avere accesso a D2L per la presentazione delle assegnazioni. Primavera 2017 semestre. Class si riunisce due volte a settimana per 75 sessioni minute, 9: 00-10: 15 AM TTH, in camera 424 (Sala Conferenze) di Bryant Bannister Albero-Ring di costruzione (costruzione 45B). Il primo giorno di lezione è 12 gennaio (giovedì). L'ultimo giorno di classe è 2 maggio (martedì). Non vi è nessuna classe durante la settimana di Spring Break (11-19 marzo). Si analizzano i dati di propria scelta nei compiti in classe. Come indicato nella panoramica corso. c'è molta flessibilità nella scelta della serie temporale. Voglio fare un catalogo di adeguata serie di tempo a disposizione, ma è meglio concentrarsi il corso sul proprio set di dati. Il primo incarico prevede l'esecuzione di uno script che memorizza i dati e metadati che avete raccolto nel file di tappeto, il formato nativo di Matlab. Le successive assegnazioni traggono i dati dal file tappetino per l'analisi di serie temporali. Assegnazioni I 12 argomenti sono affrontati in sequenza nel corso del semestre, che copre circa 15 settimane. Circa le prime due settimane (4-5 incontri di classe) sono utilizzati per un certo materiale introduttivo, decidere e la raccolta vostra serie storiche, e preparando Matlab sul vostro computer portatile. Ogni settimana dopo che è dedicato a uno dei 12 argomenti del corso. Ogni assegnazione consiste nel leggere un capitolo di note, eseguendo uno script Matlab associata che si applica selezionato i metodi di analisi di serie temporali di dati, e scrivere la vostra interpretazione dei risultati. Assegnazioni richiedono la comprensione degli argomenti delle lezioni così come la capacità di utilizzare il computer e il software. Si invia assegnazioni caricandoli D2L prima classe Martedì, quando viene introdotto l'argomento successivo. La prima mezz'ora di quella classe Martedì è utilizzato per guidare l'autovalutazione del compito, compreso il caricamento di file PDF auto-classificato a D2L. Posso controllare uno o più dei compiti auto-classificato di ogni settimana (tramite la selezione casuale), e può cambiare il grado. Per scoprire come accedere assegnazioni, fare clic su File di assegnazione. Letture consistono in note di classe. Ci sono dodici tipi di. pdf Notes file. uno per ognuno degli argomenti del corso. Questi file. pdf è possibile accedere tramite il Web. Maggiori informazioni sui vari argomenti trattati nel corso può essere trovata attraverso riferimenti elencati alla fine di ogni capitolo di note di classe. Gradi si basano interamente sulle prestazioni sulle assegnazioni, ognuna delle quali vale 10 punti. Non ci sono esami. Il numero totale di punti possibili per i 12 argomenti è di 12 x 10 120. Un grado di A richiesta 90-100 percento dei possibili punti. Un grado di B richiede 80-90 per cento. Un grado di C richiede 70-80 per cento, e così via. I gradi sono assegnati da autovalutazione guidata da una rubrica presentato in classe. Il numero di punti guadagnati deve essere contrassegnato nella parte superiore di ogni assegnazione classificato. Il tuo markup della cessione dovrebbe includere l'annotazione di eventuali ribassi con riferimento ad un punto rubrica illustrato in classe (ad esempio, -0.5, rp3 indica la deduzione di -0.5 a causa di un errore relativo al punto 3 Rubrica) Assegnazioni, data in classe il Giovedi, volontà essere dovuto (caricato D2L dall'utente) prima dell'inizio della classe la seguente Martedì. La prima mezz'ora del periodo di incontro di martedì sarà dedicato alla presentazione di una rubrica di classificazione, di auto-valutazione del lavoro completato, e il caricamento delle assegnazioni auto-classificato a D2L. Questo programma ti dà 4 giorni per completare e caricare il compito di D2L prima 09:00 Martedì. D2L tiene traccia del tempo è stato caricato l'assegnazione, e nessuna penalità è valutato fino a quando viene caricato prima di 09:00 il Martedì della data di scadenza. Se avete qualche esigenza in programma di essere lontano dalla classe (ad esempio, la partecipazione ad una conferenza), si sono responsabili per caricare il tuo incarico prima di 09:00 il Martedì è dovuto, e per caricare la versione auto-classificato da 10:15 lo stesso giorno. In altre parole, il programma è la stessa per gli studenti che sono in classe. Se una situazione di emergenza viene in su (ad esempio, si ottiene l'influenza) e non può fare la cessione o la valutazione nei tempi previsti, vi prego di inviarmi una e-mail e arriveremo alcuni alloggi. In caso contrario, una penalità di 5 punti (la metà dei punti totali disponibili per l'esercizio) sarà valutata. Introduzione ai dati di serie organizzare il tempo per l'analisi una serie storica è ampiamente definito come qualsiasi serie di misure effettuate in tempi diversi. Alcune categorie descrittive di base della serie storica sono: 1) lungo vs breve, 2) anche il tempo-step vs irregolare time-step, 3) discrete vs continuo, 4) periodica vs aperiodico, 5) stazionario vs non stazionari, e 6) univariata vs multivariata . Queste proprietà nonché la sovrapposizione temporale più serie, devono essere considerate nella selezione di un insieme di dati per l'analisi in corso. Potrai analizzare la propria serie temporali nel corso. I primi passi sono per selezionare quelle serie e di memorizzarli in strutture in un file mat. Uniformità in deposito, in via preliminare è conveniente per questa classe in modo che l'attenzione può essere focalizzata sulla comprensione dei metodi di serie storiche piuttosto debug codice di computer per preparare i dati per l'analisi. Una struttura è una variabile Matlab simile a un database a che i contenuti sono accessibili tramite designatori campo testuali. Una struttura in grado di memorizzare i dati di forme diverse. Per esempio, un campo potrebbe essere una matrice serie temporale numerico, un altro potrebbe essere testo che descrive l'origine dei dati, ecc Nel primo incarico si eseguire uno script Matlab che legge la vostra serie tempo e metadati da file di testo ASCII a preparare in anticipo e memorizza i dati in strutture Matlab in un unico file tappetino. In successive assegnazioni si applicano i metodi di serie storiche ai dati mediante l'esecuzione di script e funzioni che caricare il file tappeto e operano su quelle strutture Matlab. Selezionare i dati campione da utilizzare per le assegnazioni durante il corso Read: (1) Notes1.pdf, (2) Per iniziare, accessibile dal menu di aiuto MATLAB Risposta: Eseguire lo script geosa1.m e rispondere alle domande elencate nel file in a1.pdf Come distinguere le categorie di serie storiche come avviare e chiudere MATLAB come immettere i comandi MATLAB al prompt dei comandi Come creare figure in finestra figura come esportare i dati per il vostro word processor Differenza tra gli script di MATLAB e funzioni come eseguire gli script e funzioni i sotto forma di una variabile di struttura MATLAB Come applicare la geosa1.m script per ottenere un insieme di serie temporali e metadati in strutture MATLAB la distribuzione di probabilità di una serie storica descrive la probabilità che una osservazione cade in un intervallo di valori specificato. Una distribuzione di probabilità empirica per una serie temporale può essere arrivato a di classificare e la classifica dei valori della serie. Quantili e percentili sono statistiche utili che possono essere prese direttamente dalla distribuzione di probabilità empirica. Molti test statistici parametrici assumono la serie storica è un campione da una popolazione con una particolare distribuzione di probabilità della popolazione. Spesso la popolazione viene considerata normale. Questo capitolo presenta alcune definizioni di base, statistiche e grafici relativi alla distribuzione di probabilità. Inoltre, un test (test Lilliefors) viene introdotto per verificare se un campione proviene da una distribuzione normale con media e varianza non specificata. Risposta: Eseguire lo script geosa2.m e rispondere alle domande elencate nel file di definizioni dei termini a2.pdf: serie storiche, stazionarietà, densità di probabilità, funzione distribition, quantile, diffusione, posizione, media, deviazione standard, e l'inclinazione Come interpretare la la maggior parte grafica preziosa analisi delle serie storiche - la trama serie storiche come interpretare il diagramma a riquadri, istogramma e normali parametri trama probabilità e la forma della prova standard Lilliefors distribuzione di normalità: descrizione grafica, ipotesi, nulla e alternativa ipotesi Caveat sull'interpretazione di livelli di significatività del test statistici quando le serie temporali non è casuale in tempo Come applicare geosa2.m per controllare le proprietà di distribuzione di una serie storica e testare la serie di normalità autocorrelazione si riferisce alla correlazione di una serie storica con il proprio passato e valori futuri. Autocorrelazione viene talvolta chiamato anche lag correlazione o correlazione seriale. che si riferisce alla correlazione tra i membri di una serie di numeri disposti nel tempo. autocorrelazione positiva può essere considerata una forma specifica di persistenza. una tendenza per un sistema di rimanere nello stesso stato da un'osservazione all'altra. Ad esempio, la probabilità di domani essere delle piogge è maggiore se oggi è piovoso che se oggi è asciutto. serie temporali Geophysical sono spesso autocorrelato a causa dei processi di inerzia o di riporto del sistema fisico. Ad esempio, i evolvono lentamente e si spostano sistemi di bassa pressione nell'atmosfera potrebbero conferire persistenza precipitazioni giornaliere. O il lento drenaggio delle riserve di acque sotterranee potrebbe impartire correlazione ai flussi annuali successivi di un fiume. O fotosintesi memorizzati potrebbero impartire correlazione con valori annuali successivi di indici anelli degli alberi. Autocorrelazione complica l'applicazione di test statistici riducendo il numero di osservazioni indipendenti. Autocorrelazione può anche complicare l'identificazione di covarianza significativa o correlazione tra le serie temporali (per esempio precipitazione con una serie anelli degli alberi). Autocorrelazione può essere sfruttato per le previsioni: una serie temporale autocorrelazione è prevedibile, probabilisticamente, perché i valori futuri dipendono dai valori attuali e passati. Tre strumenti per valutare l'autocorrelazione di una serie storica sono (1) la trama Time Series, (2) la dispersione ritardato, e (3) la funzione di autocorrelazione. Risposta: Eseguire lo script geosa3.m e rispondere alle domande elencate nel file in Definizioni a3.pdf: autocorrelazione, la persistenza, correlazione seriale, funzione di autocorrelazione (ACF), la funzione autocovarianza (ACVF), dimensione effettiva del campione Come riconoscere autocorrelazione nelle serie temporali tracciare Come utilizzare dispersione ritardati per valutare autocorrelazione come interpretare i tracciati ACF Come regolare la dimensione del campione per autocorrelazione definizione matematica dei Termini funzione di autocorrelazione che influenzano la larghezza della banda di confidenza calcolato dell'ACF la differenza tra una unilaterale e due Test - sided di notevole lag-1 autocorrelazione come applicare geos3.m per studiare l'autocorrelazione di una serie temporale lo spettro di una serie temporale è la distribuzione della varianza della serie in funzione della frequenza. L'oggetto della analisi spettrale è stimare e studiare spettro. Lo spettro contiene alcuna nuova informazione oltre che nella funzione autocovarianza (ACVF), e infatti la spettro può essere calcolata matematicamente dalla trasformazione del ACVF. Ma lo spettro e ACVF presentano le informazioni sulla varianza delle serie da punti di vista complementari. ACF riassume le informazioni nel dominio del tempo e lo spettro nel dominio della frequenza. Risposta: Eseguire lo script geosa4.m e rispondere alle domande elencate nel file in Definizioni a4.pdf: frequenza, periodo, lunghezza d'onda, spettro, frequenza di Nyquist, frequenze di Fourier, Motivi di larghezza di banda per l'analisi di uno spettro Come interpretare uno spettro tracciato in termini di distribuzione della varianza la differenza tra uno spettro e spettro normalizzato Definizione della finestra lag usati nella stima spettro dal metodo Blackman-Tukey come la scelta della finestra lag colpisce la larghezza di banda e la varianza dello spettro stimato come definire uno spettro di rumore bianco e lo spettro autoregressiva Come disegnare alcune forme spettrali tipiche: rumore bianco, autoregressivi,, a bassa frequenza quasi-periodico, ad alta frequenza Come applicare geosa4.m per analizzare lo spettro di una serie storica con il metodo Blackman-Tukey Autoregressive-Moving medio (ARMA) modellazione Autoregressive-media mobile modelli (ARMA) sono modelli matematici di persistenza, o di autocorrelazione, in una serie temporale. modelli ARMA sono ampiamente utilizzati in idrologia, dendrocronologia, econometria, e altri campi. Ci sono diversi motivi possibili per il montaggio modelli ARMA ai dati. Modellazione può contribuire alla comprensione del sistema fisico, rivelando qualcosa circa il processo fisico che costruisce la persistenza nella serie. Per esempio, un modello di acqua-equilibrio fisico semplice che consiste di termini per l'ingresso precipitazione, evaporazione, infiltrazione e stoccaggio sotterranee può essere dimostrato di produrre una serie streamflow che segue una particolare forma di modello ARMA. modelli ARMA possono anche essere utilizzati per prevedere il comportamento di una serie temporale da soli valori passati. Tale previsione può essere utilizzato come base per valutare possibile importanza di altre variabili del sistema. modelli ARMA sono ampiamente utilizzati per la previsione di serie storiche economiche e industriali. modelli ARMA possono anche essere utilizzati per rimuovere persistenza. In dendrocronologia, per esempio, ARMA modellazione viene applicata regolarmente per generare residua serie cronologie tempo di indice anello di larghezza, senza dipendenza da valori passati. Questa operazione, denominata prewhitening, è destinato a rimuovere la persistenza biologicamente legati dalla serie in modo che il residuo può essere più adatto per studiare l'influenza del clima e altri fattori ambientali esterni sulla crescita degli alberi. Risposta: Eseguire lo script geosa5.m e rispondere alle domande elencate nel file in a5.pdf La forma funzionale dei più semplici modelli AR e ARMA Perché tali modelli sono indicati come autoregressiva o media mobile I tre passi in ARMA modellare i modelli diagnostici del autocorrelazione e le funzioni di autocorrelazione parziale per un AR (1) serie temporali Definizione dell'errore di previsione finale (FPE) e come la FPE viene utilizzato per selezionare un migliore ARMA modello di definizione della statistica Portmanteau, e come esso e l'ACF dei residui può essere utilizzato per valutare se un modello ARMA efficacemente modelli la persistenza di una serie Come principio di parsimonia è applicata in ARMA modellazione Definizione prewhitening Come prewhitening influisce (1) l'aspetto di una serie temporale, e (2) lo spettro di una serie temporale Come applicare geosa5.m a ARMA-modello di una serie temporale analisi spettrale - metodo periodogramma lisciato ci sono molti metodi disponibili per la stima dello spettro di una serie storica. Nella lezione 4 abbiamo preso in considerazione il metodo Blackman-Tukey, che si basa sulla trasformazione del Fourier, la funzione autocovarianza troncato levigata. Il metodo periodogramma levigata elude la trasformazione della ACF da Fourier trasformazione diretta della serie temporale e calcolo del periodogramma grezzo, una funzione introdotta nel 1800 per lo studio delle serie storiche. Il periodogramma grezzo viene lisciata applicando combinazioni o campate di uno o più filtri per produrre lo spettro stimato. La scorrevolezza, la risoluzione e la varianza delle stime spettrali è controllata dalla scelta dei filtri. Un livellamento più accentuata del periodogramma grezzo produce un sottostante spettro senza intoppi o meno, o continuo nullo, contro il quale i picchi spettrali possono essere testati per la significatività. Questo approccio è un'alternativa alla specifica di una forma funzionale del continuum nullo (ad es spettro AR). Risposta: Eseguire lo script geosa6.m e rispondere alle domande elencate nel file in Definizioni a6.pdf: periodogramma grezzo, filtro Daniell, arco di filtro, null scorrevolezza continuità, la stabilità e la risoluzione dello spettro rastremazione, imbottitura, perdite Le quattro fasi principali nella stima lo spettro dalle periodogramma levigate Come l'effetto della scelta del filtro si estende sulla scorrevolezza, stabilità e la risoluzione dello spettro Come continuum null viene utilizzato nei test di significatività di picchi spettrali Come applicare geosa6.m per stimare lo spettro di un tempo serie con il metodo periodogramma levigata e test periodicità ad una tendenza frequenza specificata in una serie temporale è un lento, graduale cambiamento di alcune proprietà delle serie sull'intero intervallo in esame. Trend a volte è genericamente definito come un cambiamento a lungo termine nel mezzo (Figura 7.1), ma può anche riferirsi a cambiare in altre proprietà statistiche. Per esempio, la serie degli anelli degli alberi di larghezza dell'anello misurata spesso hanno una tendenza a varianza così come media (Figura 7.2). Nel tradizionale analisi di serie temporali, una serie storica è stata scomposta in tendenza, componenti stagionali o periodici, e le fluttuazioni irregolari, e le varie parti sono stati studiati separatamente. moderne tecniche di analisi spesso trattano la serie senza tale decomposizione di routine, ma considerazione separata di tendenza è ancora spesso richiesto. Eliminazione del trend è l'operazione statistica o matematica di rimozione tendenza della serie. L'eliminazione del trend è spesso applicata per rimuovere una funzionalità pensata per alterare o oscurare i rapporti di interesse. In climatologia, per esempio, un andamento della temperatura a causa del riscaldamento urbano potrebbe oscurare una relazione tra nuvolosità e temperatura dell'aria. L'eliminazione del trend è talvolta usato come un passo di pre-elaborazione per preparare serie temporali per l'analisi con metodi che assumono stazionarietà. Molti sono disponibili metodi alternativi per l'eliminazione del trend. Semplice tendenza lineare medio può essere rimosso sottraendo una retta minimi quadrati-fit. le tendenze più complesse potrebbero richiedere diverse procedure. Ad esempio, la spline smoothing cubica è comunemente usato in dendrocronologia da montare e smontare tendenza anello larghezza che potrebbe non essere lineare, o addirittura non monotona crescente o decrescente nel tempo. Nello studio e la rimozione tendenza, è importante capire l'effetto di eliminazione del trend sulle proprietà spettrali della serie temporale. Questo effetto può essere sintetizzato dalla risposta in frequenza della funzione di eliminazione del trend. Risposta: Eseguire lo script geosa7.m e rispondere alle domande elencate nel file di definizioni a7.pdf: risposta in frequenza, spline cubica, lisciando Pro spline e contro di rapporto vs differenza l'eliminazione del trend Interpretazione dei termini dell'equazione per il parametro spline Come scegliere un spline in modo interattivo da una risposta in frequenza desiderata Come lo spettro è influenzata dalla eliminazione del trend Come misurare l'importanza della componente di trend in una serie storica Come applicare geosa7.m di scegliere in modo interattivo una funzione spline l'eliminazione del trend e detrend una serie temporale lo spettro stimato di un tempo serie dà la distribuzione della varianza in funzione della frequenza. A seconda dello scopo di analisi, alcune frequenze possono essere di maggior interesse di altri, e può essere utile per ridurre l'ampiezza delle variazioni nelle altre frequenze filtrandoli statisticamente prima visualizzazione e analisi serie. Ad esempio, le alte frequenze (anno in anno) le variazioni in un record scarico calibrato di un bacino possono essere relativamente poco importante per l'approvvigionamento idrico in un bacino con grandi serbatoi che possono memorizzare diversi anni di deflusso medio annuo. Dove variazioni a bassa frequenza sono di interesse principale, è auspicabile per lisciare il record di scarico per eliminare o ridurre le fluttuazioni di breve periodo prima di utilizzare il record di scarico per studiare l'importanza di variazioni climatiche per l'approvvigionamento idrico. Smoothing è una forma di filtraggio che produce una serie temporale in cui l'importanza delle componenti spettrali ad alta frequenza viene ridotta. Ingegneria elettronica chiamano questo tipo di filtro un filtro passa-basso, perché le variazioni a bassa frequenza sono autorizzati a passare attraverso il filtro. In un filtro passa-basso, il (lungo periodo) onde a bassa frequenza malapena influenzati dalla levigatura. È anche possibile filtrare una serie così che le variazioni a bassa frequenza sono ridotti e le variazioni ad alta frequenza inalterati. Questo tipo di filtro è chiamato filtro passa-alto. L'eliminazione del trend è una forma di filtraggio passa-alto: la linea di tendenza a muro tiene traccia delle frequenze più basse, ed i residui dalla linea di tendenza hanno avuto quelle frequenze basse rimossi. Un terzo tipo di filtraggio, chiamato filtro passa-banda, riduce o filtra le frequenze alte e basse, e lascia un po 'di banda di frequenza intermedia relativamente inalterata. In questa lezione, copriamo diversi metodi di levigatura, o di filtro passa-basso. Abbiamo già visto come il smoothing spline cubica potrebbe essere utile per questo scopo. Quattro altri tipi di filtri sono discussi qui: 1) media mobile semplice, 2) binomiale, 3) gaussiana, e 4) a finestre (metodo Hamming). Considerazioni nella scelta di un tipo di filtro passa-basso sono la risposta desiderata frequenza e la durata, o larghezza, del filtro. Risposta: Eseguire geosa8.m sceneggiatura e rispondere alle domande elencati nel file di definizioni a8.pdf: filtro, pesi dei filtri, la portata del filtro, filtro passa-basso, filtro passa-alto, passa-banda di risposta in frequenza del filtro di un filtro Come gaussiana filtro è collegata alla distribuzione gaussiana Come costruire un semplice filtro binomiale manualmente (senza computer) Come descrivere la funzione di risposta in frequenza in termini di un sistema con ingresso e uscita sinusoidale Come applicare geosa8.m per progettare in modo interattivo una gaussiana, binomio o filtro passa-basso Hamming-finestra per una serie temporale il coefficiente di Pearson prodotto-momento di correlazione è probabilmente la statistica più utilizzato per riassumere la relazione tra due variabili. La significatività statistica e avvertimenti di interpretazione del coefficiente di correlazione applicata a serie temporali sono argomenti di questa lezione. In certe ipotesi, la significatività statistica di un coefficiente di correlazione dipende solo la dimensione del campione, definito come il numero di osservazioni indipendenti. Se serie di tempo sono autocorrelati, una dimensione del campione efficace, inferiore alla dimensione effettiva del campione, dovrebbe essere utilizzato al momento di valutare il significato. rapporti transitori o spurie possono produrre una correlazione significativa per alcuni periodi e non per gli altri. La variazione nel tempo della forza di correlazione lineare può essere esaminata con trame di correlazione calcolati per una finestra scorrevole. Ma se molti coefficienti di correlazione vengono valutati contemporaneamente, gli intervalli di confidenza devono essere regolati (aggiustamento Bonferroni) per compensare l'aumento della probabilità di osservare alcune correlazioni alte dove non esiste alcuna relazione. Interpretazione delle correlazioni scorrevole può essere anche essere complicata da variazioni temporali di media e la varianza della serie, come la correlazione scorrevole riflette covariazione in termini di partenze standardizzati da mezzi nella finestra temporale di interesse, che possono differire dai mezzi a lungo termine. Infine, va sottolineato che il coefficiente di correlazione di Pearson misura forza della relazione lineare. Grafici a dispersione sono utili per verificare se la relazione è lineare. Risposta: Eseguire geosa9.m sceneggiatura e rispondere alle domande elencati nel file in a9.pdf definizione matematica delle ipotesi coefficiente di correlazione e ipotesi per il test significato del coefficiente di correlazione come calcolare livello di significatività del coefficiente di correlazione e per regolare il livello di significatività per l'autocorrelazione in le singole Avvertenze serie storiche all'interpretazione del coefficiente di correlazione aggiustamento Bonferroni per signficance livello di correlazione sotto confronti multipla inflazione della varianza del coefficiente di correlazione stimata in cui serie storica autocorrelato Possibili effetti di trasformazione dei dati sulla correlazione Come interpretare appezzamenti di correlazioni scorrevole Come applicare geosa9. m per analizzare le correlazioni e le correlazioni di scorrimento tra coppie di tempo rapporti di serie rimasta sono caratteristici di molti sistemi fisici naturali. correlazione ritardato si riferisce alla correlazione tra due serie tempo spostato nel tempo l'uno rispetto all'altro. correlazione lag è importante nello studio del rapporto tra serie temporali per due motivi. In primo luogo, una serie può avere una risposta ritardata al altre serie, o forse una risposta ritardata ad uno stimolo comune che colpisce entrambe le serie. In secondo luogo, la risposta di una serie di altre serie o uno stimolo esterno può essere spalmato nel tempo, tale che uno stimolo limitato a una osservazione suscita una risposta a osservazioni multiple. Ad esempio, a causa di stoccaggio in serbatoi, ghiacciai, ecc lo scarico del volume di un fiume in un anno può dipendere precipitazioni negli anni precedenti. Oa causa di cambiamenti della densità corona e stoccaggio fotosintesi, la larghezza di un albero-ring in un anno può dipendere clima di diversi anni precedenti. La semplice coefficiente di correlazione tra le due serie correttamente allineato nel tempo è insufficiente per caratterizzare il rapporto in tali situazioni. Funzioni utili esamineremo come alternativa al semplice coefficiente di correlazione sono la funzione di cross-correlazione e la funzione di risposta impulsiva. La funzione di correlazione incrociata è la correlazione tra la serie spostato uno contro l'altro in funzione del numero di osservazioni del offset. Se la singola serie sono autocorrelato, la funzione di correlazione incrociata stimata può essere distorto e fuorviante come misura del rapporto ritardato. Prenderemo in esame due approcci per chiarire il modello di cross-correlazioni. Uno è quello di rimuovere singolarmente persistenza da o prewhiten, la serie prima stima cross-correlazione. In questo approccio, le due serie sono essenzialmente considerate sullo stesso piano. Un'alternativa è l'approccio sistemi: visualizzare la serie come un sistema dinamico lineare - una serie l'ingresso e l'altra uscita - e stimare la risposta impulsiva. La funzione di risposta all'impulso è la risposta della produzione ai tempi attuali e futuri ad un ipotetico impulso di ingresso limitata al tempo corrente. Answer: Run script geosa10.m and answer questions listed in the file in a10.pdf Definitions: cross-covariance function, cross-correlation function, impulse response function, lagged correlation, causal, linear How autocorrelation can distort the pattern of cross-correlations and how prewhitening is used to clarify the pattern The distinction between the equal footing and systems approaches to lagged bivariate relationships Which types of situations the impulse response function (irf) is an appropriate tool How to represent the causal system treated by the irf in a flow diagram How to apply geos10.m to analyze the lagged cross-correlation structure of a a pair of time series Multiple linear regression Multiple linear regression (MLR) is a method used to model the linear relationship between a dependent variable and one or more independent variables. The dependent variable is sometimes also called the predictand, and the independent variables the predictors. MLR is based on least squares: the model is fit such that the sum-of-squares of differences of observed and predicted values is minimized. MLR is probably the most widely used method in dendroclimatology for developing models to reconstruct climate variables from tree-ring series. Typically, a climatic variable is defined as the predictand and tree-ring variables from one or more sites are defined as predictors. The model is fit to a period -- the calibration period -- for which climatic and tree-ring data overlap. In the process of fitting, or estimating, the model, statistics are computed that summarize the accuracy of the regression model for the calibration period. The performance of the model on data not used to fit the model is usually checked in some way by a process called validation. Finally, tree-ring data from before the calibration period are substituted into the prediction equation to get a reconstruction of the predictand. The reconstruction is a prediction in the sense that the regression model is applied to generate estimates of the predictand variable outside the period used to fit the data. The uncertainty in the reconstruction is summarized by confidence intervals, which can be computed by various alternative ways. Answer: Run script geosa11.m (Part 1) and answer questions listed in the file in a11.pdf The equation for the MLR model Assumptions for the MLR model Definitions of MLR statistics: coefficient of determination, sums-of-squares terms, overall-F for the regression equation, standard error of the estimate, adjusted R-squared, pool of potential predictors The steps in an analysis of residuals How to apply geosa11.m (part 1) to fit a MLR regression model to predict one variable from a set of several predictor variables Validating the regression model Regression R-squared, even if adjusted for loss of degrees of freedom due to the number of predictors in the model, can give a misleading, overly optimistic view of accuracy of prediction when the model is applied outside the calibration period. Application outside the calibration period is the rule rather than the exception in dendroclimatology. The calibration-period statistics are typically biased because the model is tuned for maximum agreement in the calibration period. Sometimes too large a pool of potential predictors is used in automated procedures to select final predictors. Another possible problem is that the calibration period itself may be anomalous in terms of the relationships between the variables: modeled relationships may hold up for some periods of time but not for others. It is advisable therefore to validate the regression model by testing the model on data not used to fit the model. Several approaches to validation are available. Among these are cross-validation and split-sample validation. In cross-validation, a series of regression models is fit, each time deleting a different observation from the calibration set and using the model to predict the predictand for the deleted observation. The merged series of predictions for deleted observations is then checked for accuracy against the observed data. In split-sample calibration, the model is fit to some portion of the data (say, the second half), and accuracy is measured on the predictions for the other half of the data. The calibration and validation periods are then exchanged and the process repeated. In any regression problem it is also important to keep in mind that modeled relationships may not be valid for periods when the predictors are outside their ranges for the calibration period: the multivariate distribution of the predictors for some observations outside the calibration period may have no analog in the calibration period. The distinction of predictions as extrapolations versus interpolations is useful in flagging such occurrences. Answer: Run script geosa11.m (Part 2) and answer questions listed in the file in a12.pdf Definitions: validation, cross-validation, split-sample validation, mean square error (MSE), root-mean-square error (RMSE) standard error of prediction, PRESS statistic, hat matrix, extrapolation vs interpolation Advantages of cross-validation over alternative validation methods How to apply geosa11.m (part 2) for cross-validated MLR modeling of the relationship between a predictand and predictors, including generation of a reconstruction and confidence bands Downloading Files -- tsfiles. zip The Matlab class scripts and user-written functions are zipped in a file called tsfiles. zip. To get the files, first create an empty directory on your computer. This is where you will store all functions, scripts and data used in the course. Go to D2L, or click on tsfiles. zip to download the zip file to that directory and unzip it there. When you run matlab, be sure that directory is your current matlab working directory. Powerpoint lecture outlines miscellaneous files. Downloadable file other. zip has miscellaneous files used in lectures. Included are Matlab demo scripts, sample data files, user-written functions used by demo scripts, and powerpoint presentations, as pdfs (lect1a. pdf, lect1b. pdf, etc.) used in on-campus lectures. I update other. zip over the semester, and add the presentation for the current lecture within a couple of days after that lecture is given. To run the Matlab scripts for the assignments, you must have your data, the class scripts, and the user-written Matlab functions called by the scripts in a single directory on your computer. The name of this directory is unimportant. Under Windows, it might be something like C:geos585a. The functions and scripts provided for the course should not require any tailoring, but some changes can be made for convenience. For example, scripts and functions will typically prompt you for the name of your input data file and present Spring17 as the default. That is because Ive stored the sample data in Spring17.mat. If you want to avoid having to type over Spring17 with the name of your own data file each time you run the script, edit the matlab script with the Matlab editordebugger to change one line. In the editor, search for the string Spring17 and replace it with the name of your. mat storage file (e. g. Smith2017), then be sure to re-save the edited script.
No comments:
Post a Comment