El protocolo humano redefine el mercado de marcado de datos y crowdsourcing para lograr una mejor precisión

El protocolo humano redefine el mercado de marcado de datos y crowdsourcing para lograr una mejor precisión

La inteligencia artificial (AI) solo puede cumplir con su propósito si está capacitado en datos de alta calidad. El éxito de un algoritmo de IA depende en gran medida de la calidad y cantidad de los datos de capacitación utilizados. En consecuencia, no debería sorprender La creación de un proyecto AI se dedica a la optimización de datos de entrenamiento

La mayoría de los proyectos de IA se enfrentan a la difícil tarea de recopilar o comprar datos de alta calidad. Hay varios casos en los que los proyectos a menudo terminan con datos de baja calidad o datos marcados. Si bien se han creado varios servicios de identificación de datos en los últimos años que enfrentan el desafío hasta cierto punto, tienen sus propios problemas. Las principales razones de los datos marcados de baja calidad son, por ejemplo, las personas, procesos o tecnologías utilizadas para el etiquetado.

Pero, ¿qué exactamente se etiquetan con datos?

Marcado de datos: el combustible para modelos AI

En relación con la IA, los datos marcados se relacionan con los datos que están "marcados o comentados" para que un modelo de aprendizaje automático pueda predecir el resultado deseado. En general, todo el proceso de identificación de datos generalmente incluye varios pasos, como comentarios de datos, clasificación, etiquetado, moderación y procesamiento.

Hay varios enfoques para el etiquetado de datos que se pueden usar independientemente entre sí o en combinación. Esto incluye marcado de datos internos, subcontratación, crowdsourcing y el uso de máquinas (por las cuales los datos se etiquetan utilizando algoritmos de aprendizaje automático).

Dependiendo de la complejidad del problema, los proyectos de IA a menudo utilizan procesos de etiquetado extensos para convertir datos no etiquetados en los datos de capacitación que necesita para enseñar sus modelos de IA, que pueden identificarse para crear la edición deseada.

De los muchos métodos disponibles es el crowdsourcing, en el que se utiliza una plataforma de terceros para acceder a grandes cantidades de trabajadores humanos al mismo tiempo, una de las tácticas de proyectos más utilizadas para identificar datos. En los últimos años, entre otras cosas, varias plataformas como Amazon Mturk, Appen Meeta Dash, Label Box y Tagog se han convertido en algunas de las plataformas más prometedoras para los trabajadores humanos de crowdsourcing para la marca de los datos.

Sin embargo, varios proyectos han expresado su preocupación por la calidad de los datos de las plataformas de crowdsourcing. Por ejemplo, tome el problema de la calidad de los datos con Amazon Mechanical Turk (MTURK), que se remonta a 2018. Muchos investigadores de datos sospechan que los datos que usan bots además de la mitad y el código o los scripts totalmente automáticos se identificaron para apoyar a las personas en la reacción rápidamente a ciertos conjuntos de datos.

Parte del problema se atribuyó a usuarios de diferentes ubicaciones que usaron VPN para participar en encuestas y cuestionarios que no eran adecuados para su esquema de área. Dado que las plataformas de crowdsourcing pagan a los trabajadores humanos adecuadamente para completar las tareas, los usuarios a menudo participan en actividades dobles para lograr más ingresos. Por ejemplo, varios usuarios de diferentes países pueden usar VPN para participar en un programa de identificación de datos que requiere ciertas respuestas de los residentes estadounidenses. Esto conduce a respuestas inferiores y no sensibles, lo que a su vez reduce la calidad de los datos.

Si se envían datos de baja calidad, esto plantea serias preguntas sobre el proceso de garantía de calidad existente. Dado que la mayoría de las plataformas de crowdsourcing existentes para la identificación de datos están fuertemente centralizadas, es casi imposible evaluar la calidad y el flujo de trabajo. Todos estos problemas, combinados con el crecimiento similar al cometa de la tecnología blockchain, han allanado el camino para soluciones descentralizadas y sin aprobación de crowdsourcing.

Aquí el protocolo humano presenta un nuevo enfoque nuevo para el etiquetado de datos mediante la creación de una infraestructura que respalde los mercados laborales sin permiso que también proporciona a los trabajadores humanos trabajo y brindan a las organizaciones acceso a trabajadores, todo sin intermediarios centrales.

Facilitar los mercados laborales sin aprobación

Protocolo humano

El protocolo humano es naturalmente una infraestructura de código abierto descentralizada y automatizada que ofrece un marco híbrido para la organización, evaluación y remuneración del trabajo humano. El protocolo humano atiende tanto a los intereses de los empleados como a los empleadores. Como resultado, se puede utilizar en una variedad de aplicaciones, incluidos los proyectos de crowdsourcing y basados en conciertos.

Aunque el protocolo humano es casi universalmente aplicable, primero se centra en el apoyo de los mercados descentralizados en relación con el aprendizaje automático (ML). Para ser más precisos, el protocolo humano facilita la registro de grandes cantidades de datos de comentarios humanos de alta calidad al tiempo que mantiene niveles de servicio óptimos.

Si bien el protocolo humano surgió originalmente de HCaptcha, uno de los servicios de Captcha más populares y probados en la Web 2.0, la plataforma se ha establecido como una unidad completamente única al ofrecer la tecnología subyacente para apoyar los mercados de todos los rondas en los que casi todas las tareas que incluyen la identificación de datos de la tarea, el civilización posible.

El mercado laboral humano actualmente ofrece mercados de asistencia de video, imagen y texto en los que se unen los compradores y vendedores. El protocolo subyacente puede dividir un trabajo (tarea) a muchos de estos mercados y enviarlo a los intercambios correspondientes (las solicitudes que los trabajadores usan para hacer el trabajo). Además, puede contrarrestar los datos en todos los mercados laborales para garantizar la calidad.

Además, el equipo de protocolo humano ha seleccionado las mejores herramientas disponibles para cada mercado laboral. Han desarrollado los intercambios y los optimizan continuamente para ofrecer a los empleados todo lo que necesitan para completar las tareas solicitadas. El protocolo también contiene herramientas que mantienen un control de calidad de extremo a extremo sobre los trabajos transmitidos. Esto significa efectivamente que las solicitudes reciben un resultado más determinista si se realizan trabajos similares sobre el mismo intercambio.

Después de todo, el protocolo humano ofrece una solución completamente abierta en comparación con las plataformas fuertemente centralizadas y microgestionadas, lo que permite a una variedad de proyectos usar su infraestructura. Además, también ofrece la posibilidad de ayudar a los proyectos a agregar sus propias herramientas para cumplir con los requisitos para el etiquetado de datos de manera más precisa, eficiente y sin distribuidores intermedios. Lo más importante es que la lista, distribución y remuneración de trabajos se automatizan además de millones de micro pagos, gracias a la aplicación de la tecnología blockchain del protocolo, para facilitar las transacciones y la facturación de una manera ordenada, confiable y justa.


Fuente: crypto-news-flash.com

Kommentare (0)