O protocolo humano redefine o mercado de marcação de dados e crowdsourcing para obter melhor precisão

O protocolo humano redefine o mercado de marcação de dados e crowdsourcing para obter melhor precisão

Inteligência artificial (AI) só pode cumprir seu objetivo se for treinado em dados de alta qualidade. O sucesso de um algoritmo de IA depende em grande parte da qualidade e quantidade dos dados de treinamento utilizados. Consequentemente, não deve surpreender A criação de um projeto de IA é dedicada à otimização dos dados de treinamento A maioria dos projetos de IA é confrontada com a difícil tarefa de coletar ou comprar dados de alta qualidade. Existem vários casos em que os projetos geralmente terminam com dados de baixa qualidade ou dados marcados. Embora vários serviços de identificação de dados tenham sido criados nos últimos anos que enfrentam o desafio até certo ponto, eles têm seus próprios problemas. Os principais motivos dos dados marcados de baixa qualidade são, por exemplo, as pessoas, processos ou tecnologias usados para rotular.

Mas o que exatamente são rotulados dados?

marcação de dados: o combustível para modelos de IA

Em conexão com a IA, os dados marcados estão relacionados a dados que são "marcados ou comentados" para que um modelo de aprendizado de máquina possa prever o resultado desejado. Em geral, todo o processo de identificação de dados geralmente inclui várias etapas, como comentários de dados, classificação, marcação, moderação e processamento.

Existem várias abordagens para a rotulagem de dados que podem ser usadas independentemente uma da outra ou em combinação. Isso inclui marcação de dados internos, terceirização, crowdsourcing e uso de máquinas (em que os dados são rotulados usando algoritmos de aprendizado de máquina).

Dependendo da complexidade do problema, os projetos de IA geralmente usam processos de rotulagem extensos para converter dados não rotulados nos dados de treinamento que você precisa para ensinar seus modelos de IA, que podem ser identificados para criar a edição desejada.

dos muitos métodos disponíveis é o crowdsourcing, no qual uma plataforma de terceiros é usada para acessar grandes quantidades de trabalhadores humanos ao mesmo tempo, uma das táticas mais usadas de projetos para identificar dados. Nos últimos anos, entre outras coisas, várias plataformas como Amazon Mturk, Appen Meeta Dash, Label Box e Tagog emergiram como algumas das plataformas mais promissoras para trabalhadores humanos de crowdsourcing para marcação de dados.

No entanto, vários projetos expressaram preocupações sobre a qualidade dos dados das plataformas de crowdsourcing. Por exemplo, pegue o problema de qualidade dos dados com o Amazon Mechanical Turk (MTURK), que remonta a 2018. Muitos pesquisadores de dados suspeitam que dados usando bots, além de metade e código ou scripts totalmente automáticos, foram identificados para apoiar as pessoas na reação rapidamente a determinados conjuntos de dados.

parte do problema foi atribuído a usuários de diferentes locais que usaram VPNs para participar de pesquisas e questionários que não eram adequados para o seu esquema de área. Como as plataformas de crowdsourcing pagam aos trabalhadores humanos adequadamente pela conclusão das tarefas, os usuários geralmente participam de atividades duplas para obter mais renda. Por exemplo, vários usuários de diferentes países podem usar a VPN para participar de um programa de identificação de dados que requer certas respostas dos residentes americanos. Isso leva a respostas inferiores e sem sentido, o que, por sua vez, reduz a qualidade dos dados.

Se os dados de baixa qualidade forem enviados, isso levanta sérias questões sobre o processo de garantia de qualidade existente. Como a maioria das plataformas de crowdsourcing existentes para identificação de dados são fortemente centralizadas, é quase impossível avaliar a qualidade e o fluxo de trabalho. Todos esses problemas, combinados com o crescimento do cometa da tecnologia blockchain, abriram o caminho para soluções de crowdsourcing descentralizadas e livres de aprovação.

Aqui o protocolo humano apresenta uma nova abordagem para rotular de dados, criando uma infraestrutura que suporta os mercados de trabalho sem permissão que também fornecem aos trabalhadores humanos trabalhar e dar às organizações acesso aos trabalhadores-tudo sem intermediários centrais.

facilitando os mercados de trabalho sem aprovação

Protocolo humano

O protocolo humano é naturalmente uma infraestrutura de código aberto descentralizado e automatizado que oferece um quadro híbrido para organização, avaliação e remuneração do trabalho humano. O Protocolo Humano serve aos interesses de funcionários e empregadores. Como resultado, ele pode ser usado em uma variedade de aplicações, incluindo projetos baseados em crowdsourcing e shows.

Embora o protocolo humano seja quase universalmente aplicável, ele se concentra primeiro no suporte de mercados descentralizados em conexão com o aprendizado de máquina (ML). Para ser mais preciso, o protocolo humano facilita o registro de grandes quantidades de dados de comentários humanos de alta qualidade, mantendo os níveis ideais de serviço.

Enquanto o protocolo humano emergiu originalmente de Hcaptcha, um dos serviços CAPTCHA mais populares e testados no Web 2.0, a plataforma se estabeleceu como uma unidade completamente única, oferecendo a tecnologia subjacente para suportar todos os mercados em renda nos quais quase todas as tarefas de identificação de dados de dados possíveis.

O mercado de trabalho humano atualmente oferece mercados de assistência de vídeo, imagem e texto nos quais compradores e vendedores são reunidos. O protocolo subjacente pode dividir um trabalho (tarefa) para muitos desses mercados e enviá -lo para as trocas correspondentes (os pedidos que os trabalhadores usam para fazer o trabalho). Além disso, ele pode neutralizar os dados em todos os mercados de trabalho para garantir a qualidade.

Além disso, a equipe de protocolo humano selecionou as melhores ferramentas disponíveis para todos os mercados de trabalho. Eles desenvolveram as trocas e otimizam -os continuamente para oferecer aos funcionários tudo o que precisam para concluir as tarefas solicitadas. O protocolo também contém ferramentas que mantêm um controle de qualidade de ponta a ponta sobre os trabalhos transmitidos. Isso significa efetivamente que as solicitações recebem um resultado mais determinístico se trabalhos semelhantes forem realizados sobre a mesma troca.

Afinal, o Protocolo Humano oferece uma solução completamente aberta em comparação com plataformas fortemente centralizadas e micro-gerenciadas, o que permite que uma variedade de projetos use sua infraestrutura. Além disso, ele também oferece a possibilidade de ajudar os projetos a adicionar suas próprias ferramentas para atender aos requisitos para rotular de dados com mais precisão, eficiência e sem revendedores intermediários. O mais importante é que a listagem, a distribuição e a remuneração dos trabalhos seja automatizada, além de milhões de micro-pagamentos, graças à aplicação da tecnologia blockchain do protocolo, para facilitar transações e cobrança para uma maneira ordenada, confiável e justa.

Kommentare (0)