Bienvenido a la Parte 2 de nuestra serie de PNL. si atrapaste Parte 1recordará que el desafío que estamos abordando es traducir texto en números para que podamos introducirlo en nuestros modelos de aprendizaje automático o redes neuronales.
Anteriormente, exploramos algunos enfoques básicos (y bastante ingenuos) para esto, como Bag of Words y TF-IDF. Si bien estos métodos funcionan, también vimos sus limitaciones, principalmente que no capturan el significado más profundo de las palabras o las relaciones entre ellas.
Aquí es donde incrustaciones de palabras entre. Ofrecen una forma más inteligente de representar texto como números, capturando no solo las palabras en sí sino también su significado y contexto.
Analicémoslo con una analogía simple que hará que este concepto sea súper intuitivo.
Imaginemos que queremos representar películas como números.. Toma la película Cuchillos fuera como ejemplo.
Podemos representar una película numéricamente puntuándola según diferentes características, como…