Thursday, 19 October 2017

Glidande medelvärde panel data stata


Denna datastruktur är ganska olämplig för ändamål. Om du antar ett identifierings-ID måste du omforma e g. Då är ett rörligt medelvärde enkelt. Använd tssmooth eller bara skapa e g. Mer på varför är din datastruktur ganska olämplig Inte bara skulle beräkning av ett glidande medelvärde Behöver en slinga som inte nödvändigtvis involverar egen men du skulle skapa flera nya extravariabler Att använda dem i någon efterföljande analys skulle vara någonstans mellan obekväm och omöjlig. EDIT Jag ska ge en provslinga, medan jag inte flyttar från min inställning att det är dålig teknik Jag ser inte en orsak till din namngivningskonvention, där P1947 är ett medelvärde för 1943-1945 Jag antar att det bara är ett typsnitt Låt oss anta att vi har data för 1913-2012 För 3 år förlorar vi ett år i varje ände . Det kan skrivas mer kortfattat, på bekostnad av en maka av makron i makron. Att använda ojämna vikter är enkelt, som ovan. Den enda anledningen till att använda egen är att den inte ge upp om det finns missningar, vilket ovanstående kommer att göra. Som en fråga om fullständig Ess, notera att det är lätt att hantera missningar utan att tillgripa egen. and nämnaren. Om alla värden saknas minskar detta till 0 0, eller saknas Annars, om något värde saknas lägger vi 0 till täljaren och 0 till nämnaren, som är densamma som att ignorera den Naturligtvis är koden tolerabel som ovan i medeltal om 3 år, men antingen för det fallet eller för medelvärdet under flera år skulle vi ersätta raderna ovan med en slinga, vilket är vad som gör . Jag har en lista över personer, registreringstider och poäng I Stata vill jag beräkna ett glidande medelvärde av poäng baserat på ett tidsfönster runt varje observation, inte ett fönster baserat på fördröjande ledande antal observationer. Till exempel, förutsatt att 2 dagar på båda sidor och inte med den nuvarande observationen, försöker jag beräkna något som detta. Jag försökte definiera datasetet med tsset och sedan använda TSSmooth men kunde inte få det att fungera eftersom det kan finnas flera observationer under en viss tidsperiod Jag är inte säker på att detta är Även rätt inställning Även i verkligheten är dagvariabeln en tc timestamp. asked dec 6 13 på 16 04.tsset kan inte hjälpa här även om du gjorde dina tider regelbundet, eftersom du har några upprepade värden för tiden, men dina data Kvalificera inte som paneldata i Stata s men men problemet borde ge en loop över möjligheter. Låt oss ta ditt exempel bokstavligen med heltalsdagar. Här antar vi inga saknade värden Principen att vidarebefordra är en del av andra summan av allt - det här värdet antal värden - 1. I praktiken vill du inte slingra över alla möjliga datumstider i millisekunder Så, försök en slinga över observationer av detta formulär Observera pseudokodelement. Detta papper är också relevant. Om missförhållanden är möjligt, en rad måste vara mer komplicerad. Med tanke på att om det nuvarande värdet saknas subtraherar vi 0 från summan och 0 från observatorns count. EDIT Under 2 dagar i millisekunder utnyttjar den inbyggda funktionen och använder cofd 2.Stata Dataanalys och statistisk programvara. Nicho Las J Cox, Durham University, Storbritannien Christopher Baum, Boston College. egen, ma och dess begränsningar. Stata s mest uppenbara kommando för att beräkna glidande medelvärden är ma funktionen av egen. Med ett uttryck skapar det ett periodiskt glidande medelvärde för uttrycket Som standard är det taget som 3 måste vara udda. Men som den manuella inmatningen indikerar kan egen ma inte kombineras med varlist och av den anledningen är den inte tillämplig på paneldata. Den står i alla fall utanför uppsättningen kommandon som är specifikt skrivna för tidsserier, se tidsserier för detaljer. Alternativa tillvägagångssätt. För att beräkna glidande medelvärden för paneldata finns det åtminstone två val. Båda beror på att datasetet har ställts i förväg. Detta är mycket värt att göra, inte bara kan du sparar dig själv upprepade gånger med att ange panelvariabel och tidsvariabel, men Stata beter sig smart med några luckor i data.1 Skriv din egen definition med hjälp av generera. Använda operatörer av tidsserier som L och F ger definitionen av th e glidande medelvärdet som argumentet för ett genererat uttalande Om du gör det här är du naturligtvis inte begränsad till lika viktiga obetalda centrerade glidmedelvärdena beräknade av egen ma. Exempelvis skulle lika viktiga treårs glidmedel ges By. and vissa vikter kan enkelt specificeras. Du kan givetvis ange ett uttryck som logg myvar istället för ett variabelt namn som myvar. En stor fördel med detta tillvägagångssätt är att Stata automatiskt gör det rätta för paneldata som leder och fördröjda värden utarbetas inom paneler, precis som logiken dikterar att de borde vara. Den mest anmärkningsvärda nackdelen är att kommandoraden kan bli ganska lång, om det rörliga genomsnittet innefattar flera termer. Ett annat exempel är ett ensidigt rörligt medelvärde baserat endast på tidigare värden Detta kan vara användbart för att generera en adaptiv förväntning av vilken variabel som kommer att baseras rent på information hittills vad kan någon förutspå för den aktuella perioden baserat på de senaste fyra värdena , Med hjälp av ett fastviktsschema En 4-tidsfördröjning kan användas speciellt vanligen med kvartalsvisa tider. Använd egna, filter från SSC. Använd det användarskrivna egenfunktionsfiltret från egenmore-paketet på SSC I Stata 7 uppdaterat efter den 14 november 2001 , kan du installera detta paket by. after vilken hjälp egenmore pekar på detaljer om filter De två exemplen ovan skulle göras. I denna jämförelse är genereringsmetoden kanske mer genomskinlig, men vi kommer att se ett exempel på motsatsen i ett ögonblick. Lagsna är en numlist leder är negativa lags i detta fall -1 1 expanderar till -1 0 1 eller led 1, lag 0 , lag 1 Samma ficienter, en annan numlist, multiplicera motsvarande släp eller ledande objekt i det här fallet är dessa poster myvar och Effekten av normaliseringsalternativet är att skala varje koefficient med summan av koefficienterna så att coef 1 1 1 normaliserar är ekvivalent med koefficienterna 1 3 1 3 1 3 och coef 1 2 1 normalisera motsvarar koefficienterna 1 4 1 2 1 4.Du måste ange inte bara lags men även koefficienterna Eftersom egen ma ger lika viktat fall, huvudargument för egen, filter är att stödja det ojämnt viktiga fallet, för vilket du måste ange koefficienter Det kan också sägas att förplikta användarna att specificera koefficienter är ett litet extra tryck på dem för att tänka på vilka koefficienter de vill ha. för lika vikter är vi gissning, enkelhet, men lika vikter har äckliga frekvensdomänegenskaper, för att bara nämna ett övervägande. Det tredje exemplet ovan kan vara vilket som helst är så komplicerat som genereringsmetoden. Det finns fall där egen , filtrerar ger en enklare formulering än att generera Om du vill ha ett nio-termins binomialfilter, vilka klimatologer tycker är användbara, så är det kanske mindre hemskt än, och lättare att få rätt än. Bara som med genereringsmetoden fungerar egen filter korrekt med paneldata Faktum är att det som sagt ovan beror på datasetet som har ställts in tidigare. En grafisk spets. Efter att ha beräknat dina glidande medelvärden kommer du förmodligen att vilja se på ett diagram. Det användarskrivna kommandot tsgraph är smart om dataset för dataset Installera det i en aktuell Stata 7 av ssc inst tsgraph. Vad sägs om att subsätta med if. None av ovanstående exempel använder sig av om begränsningar. Egentligen, ma tillåter inte att anges. Ibland kan människor wa nt att använda om vid beräkning av glidande medelvärden men användningen är lite mer komplicerad än vad som vanligtvis är. Vad skulle du förvänta dig av ett glidande medelvärde beräknat med om Låt oss identifiera två möjligheter. Vilken tolkning jag vill inte se några resultat för de uteslutna observationerna. Stort tolkning Jag vill inte ens att du ska använda värdena för de uteslutna observationerna. Här är ett konkret exempel Antag till följd av vissa om villkoret är observationer 1-42 men inte observationer 43 på Men det glidande genomsnittet för 42 beror bland annat på värdet för observation 43 om medelvärdet sträcker sig bakåt och framåt och är av längd åtminstone 3 och det kommer också att bero på några av observationerna 44 och vidare under vissa omständigheter. Vi antar att de flesta skulle gå för den svaga tolkningen, men om det är korrekt, själv, stödjer inte filtret om du antingen alltid kan ignorera vad du inte vill eller ens ställa in oönskade värden att sakna efteråt b y använder ersättning. Anmärkning om saknade resultat i seriens ändar. Eftersom rörliga medelvärden är funktioner av lags och leads, producerar ma saknas där lags och leads inte existerar, i början och slutet av serien. Ett alternativ nomiss tvingar beräkningen av kortare, ocenterade glidmedel för svansarna. Däremot genererar eller skapar inte heller filter, eller tillåter, något speciellt för att undvika att missa resultat. Om något av de värden som behövs för beräkning saknas, saknar det resultatet är upp till användarna att bestämma om och vilken korrigering som krävs för sådana observationer, förmodligen efter att ha tittat på datasetet och med tanke på vilken underliggande vetenskap som kan bäras.

No comments:

Post a Comment