Desbloqueo de la medición de conceptos. Cómo la tarea de completar analogías cambió… | por Danielle Boccelli

Desbloqueo de la medición de conceptos. Cómo la tarea de completar analogías cambió… | por Danielle Boccelli | agosto, 2024

Foto por Evgeny Golovesov en Dejar de salpicar

Cómo la tarea de completar analogías cambió la representación de las palabras

Este ensayo tiene como objetivo discutir el desarrollo de los algoritmos word2vec y GloVe en relación con un propósito secundario para el cual se han aplicado estos algoritmos: el análisis de conceptos contenidos en corpus de texto. En primer lugar, se analiza el algoritmo word2vec a la luz de su contexto histórico. Luego, se describe la tarea de completar analogías que destacó el potencial de la aritmética semántica posible con las incrustaciones de word2vec. Finalmente, se contrasta el desarrollo del algoritmo GloVe con el algoritmo word2vec.

El algoritmo word2vec (Mikolov et al., 2013a) combina dos ideas técnicas principales: (1) los vectores continuos se pueden utilizar para representar información semántica (2) y las representaciones internas aprendidas por las redes neuronales son conceptualmente significativas. Sin embargo, cuando se presentó el algoritmo en 2013, ni la representación continua de la información semántica ni el valor conceptual de las representaciones internas eran ideas nuevas. Más específicamente, en el espacio de recuperación de información, el análisis semántico latente (LSA; Deerwester et al., 1990) y la asignación de Dirichlet latente (Blei et al., 2003) se propusieron como métodos estadísticos que aprovechan la información semántica latente en los textos para mejorar los métodos que trataban las palabras como características indexicales (que existen…

Desbloqueo de la medición de conceptos. Cómo la tarea de completar analogías cambió… | por Danielle Boccelli | agosto, 2024

ByEquipo de 7 minutos

Cómo la tarea de completar analogías cambió la representación de las palabras

By Equipo de 7 minutos

Related Post

Nous Research actualiza el agente Hermes con un modo pizarra en blanco que fija conjuntos de herramientas a través de platform_toolsets.cli ydisabled_toolsets

Cómo crear un canal de pronóstico con TimeCopilot utilizando modelos básicos y detección automatizada de anomalías

Yandex Open-Sources YaFF: un formato de cable de copia cero para Protobuf con velocidad de lectura cercana a la estructura

You missed

Cuánto dinero tiene la hija de Barack Obama – Hollywood Life

Un hipopótamo pigmeo recién nacido roba corazones en Berlín, es posible que su gato no ayude a aliviar el estrés y una ascidia podría ayudar a combatir el cáncer

Illa expresa su apoyo a Begoña Gómez y tacha de “claramente excesiva” la retirada de su pasaporte

La Pedrera propone planta solar desaladora – El Líder