- Evaluar los resultados de Pruebas A/B.
- Aplicar algunas técnicas de lenguaje natural usando Nltk y TextBlob.
Pruebas A/B
Aprendimos en el Prework que una prueba A/B (A/B Test) es un experimento con dos grupos de personas para establecer cuál de dos tratamientos, procedimientos, productos, etc, es superior.
Con base en lo que leyeron en el Prework, vamos a responder las siguientes preguntas y debatir acerca de ellas:
- ¿Qué es el grupo control y el grupo experimental? ¿Por qué es importante establecer la diferencia?
- ¿Cómo se evitan los sesgos de selección a la hora de crear estos dos grupos? ¿Por qué queremos evitar los sesgos de selección?
- ¿En qué momento decidimos cuál va a ser nuestra métrica de evaluación y por qué?
- ¿Qué es una hipótesis nula y una hipótesis alternativa? ¿Para qué nos sirve hacer una distinción entre las dos?
- ¿Qué es un test de hipótesis? ¿Qué significa que algo sea estadísticamente significativo?
- ¿En qué situaciones podemos utilizar una Prueba A/B?
En el siguiente ejemplo veremos cómo aplicar estos conceptos de una manera práctica.
Procesamiento de Lenguaje Natural
El lenguaje natural pertenece al tipo de datos que llamamos datos no estructurados. Esto se debe a que su estructura es bastante más impredecible que la de nuestros datos estructurados. Aunque existen reglas gramaticales y de sintaxis, hay mucha variedad en el uso del lenguaje, además de que la variedad posible de combinaciones es inmensamente grande.
¿Esto significa que no hay manera de entender el lenguaje natural estadísticamente? Para nada. El procesamiento de lenguaje natural reúne una serie de técnicas que nos ayudan a entender conjuntos de datos que contienen texto libre y a construir modelos que puedan servirnos para traducir entre idiomas, reconocer palabras a partir de grabaciones de audio, predecir oraciones, analizar sentimientos en un texto y mucho más.
Vamos a explorar algunas herramientas y técnicas que hacen esto posible.