Skip to content

Commit

Permalink
translated to portuguese
Browse files Browse the repository at this point in the history
  • Loading branch information
rdemarqui committed Feb 14, 2024
1 parent db860a4 commit 4d33119
Show file tree
Hide file tree
Showing 8 changed files with 39 additions and 40 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -170,11 +170,11 @@
"\n",
" $Y_{1i} - Y_{0i}$\n",
" \n",
"É claro que, devido ao problema fundamental da inferência causal, nunca podemos conhecer o efeito individual do tratamento porque só observamos um dos resultados potenciais. Por enquanto, vamos nos concentrar em algo mais fácil do que estimar o efeito individual do tratamento. Em vez disso, vamos nos concentrar no **efeito médio do tratamento** *(ATE, do inglês average treatment effect)*, que é definido da seguinte forma.\n",
"É claro que, devido ao problema fundamental da inferência causal, nunca podemos conhecer o efeito individual do tratamento porque só observamos um dos resultados potenciais. Por enquanto, vamos nos concentrar em algo mais fácil do que estimar o efeito individual do tratamento. Em vez disso, vamos nos concentrar no **efeito médio do tratamento** *(ATE, do inglês \"average treatment effect\")*, que é definido da seguinte forma.\n",
"\n",
"$ATE = E[Y_1 - Y_0]$\n",
"\n",
"onde `E[...]` é o valor esperado. Outra quantidade mais fácil de estimar é o **efeito médio do tratamento nos tratados** *(ATT, do inglês average treatment effect on the treated)*:\n",
"onde `E[...]` é o valor esperado. Outra quantidade mais fácil de estimar é o **efeito médio do tratamento nos tratados** *(ATT, do inglês \"average treatment effect on the treated\")*:\n",
"\n",
"$ATT = E[Y_1 - Y_0 | T=1]$\n",
"\n",
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -781,7 +781,7 @@
"source": [
"Observe como o valor-p é interessante porque nos evita ter que especificar um nível de confiança, como 95% ou 99%. Mas, se desejarmos relatar um, a partir do valor-p, sabemos precisamente em que nível de confiança nosso teste passará ou falhará. Por exemplo, com um valor-p de 0,0027, vemos que temos significância até o nível de 0,2%. Portanto, enquanto o intervalo de confiança de 95% e o intervalo de confiança de 99% para a diferença não conterão zero, o intervalo de confiança de 99,9% conterá. Isso significa que há apenas 0,2% de chance de observar essa estatística z extrema se a diferença fosse zero.\n",
"\n",
"Observe como o valor p é interessante porque nos evita ter que especificar um nível de confiança, como 95% ou 99%. No entanto, se desejarmos relatar um, a partir do valor-p, sabemos precisamente em qual nível de confiança nosso teste passará ou falhará. Por exemplo, com um valor p de 0,0027, vemos que temos significância até o nível de 0,2%. Assim, enquanto o CI *(do inglês Confidence Interval)* de 95% e o CI de 99% para a diferença não conterão zero, o CI de 99,9% conterá. Isso significa que há apenas 0,2% de chance de observar essa estatística z extrema se a diferença fosse zero."
"Observe como o valor p é interessante porque nos evita ter que especificar um nível de confiança, como 95% ou 99%. No entanto, se desejarmos relatar um, a partir do valor-p, sabemos precisamente em qual nível de confiança nosso teste passará ou falhará. Por exemplo, com um valor p de 0,0027, vemos que temos significância até o nível de 0,2%. Assim, enquanto o CI *(do inglês \"confidence interval\")* de 95% e o CI de 99% para a diferença não conterão zero, o CI de 99,9% conterá. Isso significa que há apenas 0,2% de chance de observar essa estatística z extrema se a diferença fosse zero."
]
},
{
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -149,7 +149,7 @@
"\\beta^* =\\underset{\\beta}{argmin} \\ E[(Y_i - X_i'\\beta)^2]\n",
"$\n",
"\n",
"A regressão linear encontra os parâmetros que minimizam o erro quadrático médio *(MSE, do inglês Mean Squared Error)*.\n",
"A regressão linear encontra os parâmetros que minimizam o erro quadrático médio *(MSE, do inglês \"mean squared error\")*.\n",
"\n",
"Se você diferenciar e igualar a zero, encontrará que a solução linear para este problema é dada por\n",
"\n",
Expand Down Expand Up @@ -1120,7 +1120,7 @@
"\n",
"## Conceitos-chave\n",
"\n",
"Nós cobrimos muito terreno com a regressão. Vimos como a regressão pode ser usada para realizar testes A/B e como convenientemente nos fornece intervalos de confiança. Em seguida, estudamos como a regressão resolve um problema de previsão e é a melhor aproximação linear para a função de expectativa condicional *(CEF, do inglês conditional expectation function)*. Também discutimos como, no caso bivariado, o coeficiente de tratamento da regressão é a covariância entre o tratamento e o resultado dividido pela variância do tratamento. Expandindo para o caso multivariado, descobrimos como a regressão nos dá uma interpretação de isolamento parcial do coeficiente de tratamento: ele pode ser interpretado como a forma como o resultado mudaria com o tratamento, mantendo todas as outras variáveis incluídas constantes. Isso é o que os economistas adoram se referir como *ceteris paribus*.\n",
"Nós cobrimos muito terreno com a regressão. Vimos como a regressão pode ser usada para realizar testes A/B e como convenientemente nos fornece intervalos de confiança. Em seguida, estudamos como a regressão resolve um problema de previsão e é a melhor aproximação linear para a função de expectativa condicional *(CEF, do inglês \"conditional expectation function\")*. Também discutimos como, no caso bivariado, o coeficiente de tratamento da regressão é a covariância entre o tratamento e o resultado dividido pela variância do tratamento. Expandindo para o caso multivariado, descobrimos como a regressão nos dá uma interpretação de isolamento parcial do coeficiente de tratamento: ele pode ser interpretado como a forma como o resultado mudaria com o tratamento, mantendo todas as outras variáveis incluídas constantes. Isso é o que os economistas adoram se referir como *ceteris paribus*.\n",
"\n",
"Por fim, fizemos uma virada para entender o viés. Vimos como `Curta igual a longa mais o efeito da omitida vezes a regressão da omitida na incluída`. Isso lançou alguma luz sobre como o viés surge. Descobrimos que a fonte do viés de variável omitida é o confundimento: uma variável que afeta tanto o tratamento quanto o resultado. Por fim, usamos gráficos causais para ver como ECR e regressão corrigem o confundimento.\n",
"\n",
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -1560,7 +1560,7 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"Quando um cientista de dados vê isso, a primeira ideia que lhe vem à mente é dividir o modelo em 2 etapas. A primeira é a participação, ou seja, a probabilidade de $Y > 0$. No nosso exemplo de gastos, isso seria modelar se o cliente decide gastar ou não. A segunda parte modela $Y$ para aqueles que decidiram participar. É o efeito Condicional-em-Positivos *(COP, do inglês Conditional-On-Positive)*. No nosso caso, seria quanto o cliente gasta depois de decidir que gastaria alguma coisa. Se quisermos estimar o efeito do tratamento $T$ nos gastos, ficaria algo assim:\n",
"Quando um cientista de dados vê isso, a primeira ideia que lhe vem à mente é dividir o modelo em 2 etapas. A primeira é a participação, ou seja, a probabilidade de $Y > 0$. No nosso exemplo de gastos, isso seria modelar se o cliente decide gastar ou não. A segunda parte modela $Y$ para aqueles que decidiram participar. É o efeito Condicional-em-Positivos *(COP, do inglês \"conditional-on-positive\")*. No nosso caso, seria quanto o cliente gasta depois de decidir que gastaria alguma coisa. Se quisermos estimar o efeito do tratamento $T$ nos gastos, ficaria algo assim:\n",
" \n",
"$\n",
"E[Y|T] = E[Y|Y>0, T]P(Y>0|T)\n",
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -8,7 +8,7 @@
"\n",
"## Contornando o Viés da Variável Omitida\n",
"\n",
"Uma maneira de controlar o Viés da Variável Omitida *(OVB, do inglês Omitted-variable bias)* é, bom, adicionando a variável omitida ao nosso modelo. No entanto, isso nem sempre é possível, principalmente porque simplesmente não temos dados sobre as variáveis omitidas. Por exemplo, voltemos ao nosso modelo para o efeito da educação no salário:\n",
"Uma maneira de controlar o Viés da Variável Omitida *(OVB, do inglês \"omitted-variable bias\")* é, bom, adicionando a variável omitida ao nosso modelo. No entanto, isso nem sempre é possível, principalmente porque simplesmente não temos dados sobre as variáveis omitidas. Por exemplo, voltemos ao nosso modelo para o efeito da educação no salário:\n",
"\n",
"$\n",
"\\log(\\mathrm{wage})_i = \\beta_0 + \\kappa \\ \\mathrm{educ}_i + \\pmb{\\beta}\\mathrm{Ability}_i + u_i\n",
Expand Down Expand Up @@ -131,7 +131,7 @@
"source": [
"Uma maneira de evitar isso é controlar os níveis constantes de habilidade ao medir o efeito da educação no salário. Poderíamos fazer isso incluindo a habilidade em nosso modelo de regressão linear. No entanto, não temos boas medidas de habilidade. O melhor que temos são alguns proxies muito questionáveis, como o QI.\n",
"\n",
"Mas nem tudo está perdido. É aqui que as Variáveis Instrumentais *(IV, do inglês Instrumental Variable)* entram em cena. A ideia do IV é encontrar outra variável que cause o tratamento e que esteja apenas correlacionada com o resultado por meio do tratamento. Outra maneira de dizer isso é que esse instrumento $Z_i$ não está correlacionado com $Y_0$, mas está correlacionado com $T$. Isso é às vezes referido como a restrição de exclusão."
"Mas nem tudo está perdido. É aqui que as Variáveis Instrumentais *(IV, do inglês \"instrumental variable\")* entram em cena. A ideia do IV é encontrar outra variável que cause o tratamento e que esteja apenas correlacionada com o resultado por meio do tratamento. Outra maneira de dizer isso é que esse instrumento $Z_i$ não está correlacionado com $Y_0$, mas está correlacionado com $T$. Isso é às vezes referido como a restrição de exclusão."
]
},
{
Expand Down
Loading

0 comments on commit 4d33119

Please sign in to comment.