• 1
  • 2
2013-12-14, 02:17
  #1
Medlem
Hej!

Jag har en fråga till er ekonometriker.

Jag gör en fixed effects-analys (FE) av paneldata, med ca 50 länder och mellan 2 till 4 tidsperioder.

Min fråga rör antagandet om att idiosyncratic errors (alltså de icke-observerade faktorer som varierar över tid) måste vara normalfördelade, såvida jag inte har ett stort antal länder och ett litet antal tidsperioder (enligt Wooldridge 2013).

Om jag vill analysera huruvida antagandet om normalfördelade idiosyncratic errors, u, stämmer så har jag undersökt de skattade residualernas fördelning genom att först köra en FE-regression och sedan spara residualerna genom att skriva ''predict residuals, e'' i Stata. Sedan analyserade jag ett histogram över dessa residualer. Är det ett korrekt förfarande? Är dessa residualer ''skattningar'' av the idiosyncratic errors på samma sätt som att residualerna i en OLS på en cross-section är ''skattningar'' av slumtermerna u? Och så länge dessa residualer är ungefärligt normalfördelade så borde väl detta vara lugnt med tanke på att jag ändå har 50 länder. Alltså så länge residualerna är tillräckligt normalfördelade så räcker väl detta för att kunna använda sig av t-test osv. för inferens (eftersom att jag har 50 länder)?

Denna fråga kan verka nischad, men jag har verkligen inte lyckats hitta någon bra info om detta just när det gäller paneldata och fixed-effects, utan bara vad gäller cross-sections och OLS. Någon som kan hjälpa till?
__________________
Senast redigerad av Endstation 2013-12-14 kl. 02:23.
Citera
2013-12-14, 12:54
  #2
Medlem
Fris avatar
Prova i matte-forumet här, eller på andra matematikforum.
Citera
2013-12-14, 16:17
  #3
Medlem
Dirr förfarande bör vara korrekt, kolla residualerna, ehat, eller u. Att dessa är ungefärligt normalfördelade.
Det viktigaste är att du har ett snitt på noll. Det kan ju finnas "gräns", dvs hur långt ifrån N-fördelning du kan anta att de är N-fördelade, dvs en skattning på de skattade felen. Men oftast räcker det att
spotta ut ett histogram, och se att de är ungefär N-fördelade. Sen kan du gå vidare.
Citera
2013-12-14, 16:27
  #4
Medlem
Fris avatar
Citat:
Ursprungligen postat av andejoha
Men oftast räcker det att
spotta ut ett histogram, och se att de är ungefär N-fördelade. Sen kan du gå vidare.
Just därför borde du fråga matematiker som saknar kontakt med ekonomiämnet...
Citera
2013-12-14, 16:35
  #5
Medlem
Ja, men detta kan ven enkelt göras i stata, jag skulle i såfall troligen kontakta en statistiker. Ej matematiker. Och att kolla hurpass anpassade dina värden är är ej så konstigt. Jag menar, du kan ju anv dug av en midifierad beta-anpassning, om du nu vill veta hur den närmaste fördelningen som du har ser ut.
Men detta gäller i grunden bara att kolla att ett antagande som skall gälla gäller. Och om du förkastar allt om de ej är en perfekt gausskurva (N-förd), så skulle inte metden vara mycket värd; dvs dess tillämpning skulle bli ytterst begränsad.


Jag tycker personligen att det är generellt dåliga kunskaper i matematisk analys, och statistik när det kommer till ekonomer. Allt är inte räta linjer som man kan försöka skatta med LR.
Citera
2013-12-14, 20:07
  #6
Medlem
Citat:
Ursprungligen postat av andejoha
Dirr förfarande bör vara korrekt, kolla residualerna, ehat, eller u. Att dessa är ungefärligt normalfördelade.
Det viktigaste är att du har ett snitt på noll. Det kan ju finnas "gräns", dvs hur långt ifrån N-fördelning du kan anta att de är N-fördelade, dvs en skattning på de skattade felen. Men oftast räcker det att
spotta ut ett histogram, och se att de är ungefär N-fördelade. Sen kan du gå vidare.

Tack för ditt svar!

En liten följdfråga. För att förtydliga vad jag frågar efter så vill jag också inflika följande: Jag fattar inte riktigt skillnaden mellan e och u i Stata efter att ha kört xtreg-kommandot. Om jag skriver ''predict residuals, e'' så får jag väl fram just skattningar av idiosyncratic errors, alltså de icke-tidskonstanta icke-observerade faktorerna? Alltså är det väl just e (och inte u) som bör vara normalfördelade? Eller? Antagandet i Wooldridge (2013) är ju att bara de icke-observerade faktorer som förändras över tid (d.v.s. idiosyncratic errors) bör vara normalfördelade när man använder fixed-effects på paneldata. Skattningar av dessa får jag väl bara genom ''predict residuals, e''-kommandot i Stata? Eller? Vad är det egentligen jag får fram när jag istället skriver ''predict residuals, u''? Av värdena jag får fram kan jag se att u bara förändras mellan länder och inte över tid, medan e förändras både mellan länder och tidsperioder. Då bör väl detta innebära att u är skattningar av de tidskonstanta icke-observerade faktorerna, medan e är skattningar av de icke-tidskonstanta icke-observerade faktorerna, eller?

Har läst allt som står i Stata-manualen men förstår ej fullt ut.
__________________
Senast redigerad av Endstation 2013-12-14 kl. 20:21.
Citera
2013-12-14, 20:19
  #7
Medlem
Citat:
Ursprungligen postat av Endstation
Tack för ditt svar!

En liten följdfråga. Om jag skriver ''predict residuals, u'' i Stata, så får jag väl fram skattningar av de tidskonstanta icke-observerade faktorerna, inte sant? Jag fattar inte riktigt skillnaden mellan e och u i Stata efter att ha kört xtreg-kommandot. Om jag skriver predict residuals, e så får jag väl fram just skattningar av idiosyncratic errors, alltså de icke-tidskonstanta icke-observerade faktorerna? Alltså är det väl just e (och inte u) som bör vara normalfördelade? Eller? Antagandet i Wooldridge (2013) är ju att bara de icke-observerade faktorer som förändras över tid bör vara normalfördelade när man använder fixed-effects på paneldata. Skattningar av dessa får jag väl bara genom ''predict residuals, e''-kommandot i Stata? Eller?

Själv kan jag ej just ditt kommande xtreg. Men ja du får fram residualerna. de bör finnas i modellen du kört. du får fram residualerna i din modell. Är det tidsserier du tittar på. Predict ger dig just predict, dvs det uppskattade värdet. Residual är ju skillnaden mellan din predict och det verkliga punketrna som du skattat modellen efter. Dvs det överdefinierade. Hade du bara haft tex, 2st punkter så hade ju din LR gerr dig en exakt linje. Vid 3 el fler görs ju en mistakvarat, dvs just minimering av kvadraten av dine residualer. Dvs per definition är den lijne du får den som minimerar kvadraten på residualerna.

Ja det bör bara vara att ta fram residualer som du beskriver.

Hoppas detta hjälpte.
Citera
2013-12-14, 20:22
  #8
Medlem
Citat:
Ursprungligen postat av andejoha
Själv kan jag ej just ditt kommande xtreg. Men ja du får fram residualerna. de bör finnas i modellen du kört. du får fram residualerna i din modell. Är det tidsserier du tittar på. Predict ger dig just predict, dvs det uppskattade värdet. Residual är ju skillnaden mellan din predict och det verkliga punketrna som du skattat modellen efter. Dvs det överdefinierade. Hade du bara haft tex, 2st punkter så hade ju din LR gerr dig en exakt linje. Vid 3 el fler görs ju en mistakvarat, dvs just minimering av kvadraten av dine residualer. Dvs per definition är den lijne du får den som minimerar kvadraten på residualerna.

Ja det bör bara vara att ta fram residualer som du beskriver.

Hoppas detta hjälpte.

Det är paneldata.
Citera
2013-12-14, 20:59
  #9
Medlem
Citat:
Ursprungligen postat av Endstation
Det är paneldata.

Är det paneldata är det väl bara jämförelser mellan grupper du vill ha, eller vill du köra en regression på de? Stata kan hantera alla mäjliga tester på skillnader och annat i grupper. Bör även finnas massor med klara .do-filer ute att finna gällande detta.
Citera
2013-12-14, 21:08
  #10
Medlem
Citat:
Ursprungligen postat av andejoha
Är det paneldata är det väl bara jämförelser mellan grupper du vill ha, eller vill du köra en regression på de? Stata kan hantera alla mäjliga tester på skillnader och annat i grupper. Bör även finnas massor med klara .do-filer ute att finna gällande detta.

Vad menar du?
__________________
Senast redigerad av Endstation 2013-12-14 kl. 21:42.
Citera
2013-12-15, 10:55
  #11
Medlem
UlkMulkens avatar
Citat:
Ursprungligen postat av Endstation
Jag gör en fixed effects-analys (FE) av paneldata, med ca 50 länder och mellan 2 till 4 tidsperioder.

Min fråga rör antagandet om att idiosyncratic errors (alltså de icke-observerade faktorer som varierar över tid) måste vara normalfördelade, såvida jag inte har ett stort antal länder och ett litet antal tidsperioder (enligt Wooldridge 2013).

Har du övervägt att modellera med en random effects modell? Eftersom din random effect kommer inrymma "unobserved heterogenity" så kan en sådan modell eventuellt hjälpa dig att skatta nivån av idiosyncratic errors i din fixed effects model.

Sen är det ju också så att fixed effects inte passar bäst för alla data. Det finns tester att göra för vilken form av modell du bör välja. Du bör alltså utföra ett test för att se vilken modell som passar dina data bäst.
Citera
2013-12-15, 18:42
  #12
Medlem
Citat:
Ursprungligen postat av UlkMulken
Har du övervägt att modellera med en random effects modell? Eftersom din random effect kommer inrymma "unobserved heterogenity" så kan en sådan modell eventuellt hjälpa dig att skatta nivån av idiosyncratic errors i din fixed effects model.

Sen är det ju också så att fixed effects inte passar bäst för alla data. Det finns tester att göra för vilken form av modell du bör välja. Du bör alltså utföra ett test för att se vilken modell som passar dina data bäst.

Hej! Tack, jag har utfört Hausman-test osv. Och enligt Doughertys textbook bör jag tveklöst använda FE och inte RE i mitt fall. Det är också mycket sannolikt att de tidskonstanta faktorer vi inte observerar är korrelerade med de förklarande variablerna i mitt fall osv.

Men är det ngn som kan svara på min fråga om normalfördelade errors? Eller var det detta du svarade på?
Citera
  • 1
  • 2

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in