Den menneskelige protokollen omdefinerer markedet for dataregering og crowddsourcing for å oppnå bedre nøyaktighet

Den menneskelige protokollen omdefinerer markedet for dataregering og crowddsourcing for å oppnå bedre nøyaktighet

Kunstig intelligens (AI) kan bare oppfylle formålet hvis den er trent på data av høy kvalitet. Suksessen til en AI -algoritme avhenger i stor grad av kvaliteten og mengden av treningsdataene som brukes. Følgelig skal det ikke overraske Opprettelsen av et AI-prosjekt er viet til optimalisering av treningsdata

De fleste AI-prosjekter blir møtt med den vanskelige oppgaven å samle inn eller kjøpe data av høy kvalitet. Det er flere tilfeller der prosjekter ofte ender med data av lav kvalitet eller merkede data. Mens flere dataidentifikasjonstjenester har blitt opprettet de siste årene som står overfor utfordringen til en viss grad, har de sine egne problemer. De viktigste årsakene til markerte data av lav kvalitet er for eksempel menneskene, prosessene eller teknologiene som brukes til merking.

Men hva er egentlig merket data?

Datamerking: drivstoffet for AI-modeller

I forbindelse med AI, merket data til data som er "merket eller kommentert" slik at en maskinlæringsmodell kan forutsi ønsket resultat. Generelt inkluderer hele dataidentifikasjonsprosessen vanligvis flere trinn, for eksempel datakommentar, klassifisering, tagging, moderasjon og prosessering.

Det er flere tilnærminger til datasikring som enten kan brukes uavhengig av hverandre eller i kombinasjon. Dette inkluderer intern datareging, outsourcing, crowddsourcing og bruk av maskiner (hvorved data er merket ved bruk av maskinlæringsalgoritmer).

Avhengig av kompleksiteten i problemet bruker AI-prosjekter ofte omfattende merkingsprosesser for å konvertere ikke merket data til treningsdataene du trenger for å lære AI-modellene dine, som kan identifiseres for å lage ønsket utgave.

av de mange tilgjengelige metodene er crowddsourcing, der en tredjeparts plattform brukes til å få tilgang til store mengder menneskelige arbeidere samtidig, en av de mest brukte taktikkene til prosjekter for å identifisere data. De siste årene, blant annet, har flere plattformer som Amazon Mturk, Appen Meeta Dash, Label Box og Tagog dukket opp som noen av de mest lovende plattformene for Crowdsourcing Human Workers for Data Marking.

Imidlertid har flere prosjekter uttrykt bekymring for datakvaliteten til crowddsourcing-plattformer. Ta for eksempel datakvalitetsproblemet med Amazon Mechanical Turk (MTURK), som går tilbake til 2018. Mange dataforskere mistenker at data ved bruk av roboter i tillegg til halv og helautomatisk kode eller skript ble identifisert for å støtte mennesker i reaksjonen raskt på visse datasett.

En del av problemet ble tilskrevet brukere fra forskjellige steder som brukte VPN-er for å delta i undersøkelser og spørreskjemaer som ikke var egnet for deres områdeordning. Siden crowddsourcing -plattformer betaler menneskelige arbeidere på riktig måte for fullføring av oppgaver, deltar brukere ofte i doble aktiviteter for å oppnå mer inntekt. For eksempel kan en rekke brukere fra forskjellige land bruke VPN til å delta i et dataidentifikasjonsprogram som krever visse svar fra amerikanske innbyggere. Dette fører til underordnede og nonsensiske svar, som igjen senker datakvaliteten.

Hvis data av lav kvalitet sendes inn, reiser dette alvorlige spørsmål om den eksisterende kvalitetssikringsprosessen. Siden de fleste av de eksisterende crowddsourcing -plattformene for dataidentifikasjon er sterkt sentraliserte, er det nesten umulig å vurdere kvaliteten og arbeidsflyten. Alle disse problemene, sammenkoblet med den kometlignende veksten av blockchain-teknologi, har banet vei for desentraliserte og godkjenningsfrie crowddsourcing-løsninger.

Her presenterer den menneskelige protokollen en ny ny tilnærming til datasikring ved å lage en infrastruktur som støtter de tillatelsesløse arbeidsmarkedene som også gir menneskelige arbeidere arbeid og gir organisasjoner tilgang til arbeidere-alle uten sentrale mellomledd.

tilrettelegging for godkjenningsfrie jobbmarkeder

Menneskelig protokoll

Den menneskelige protokollen er naturlig nok en desentralisert og automatisert open source-infrastruktur som tilbyr en hybridramme for organisering, evaluering og godtgjørelse av menneskelig arbeid. Den menneskelige protokollen tjener både interessene til ansatte og arbeidsgivere. Som et resultat kan det brukes i en rekke applikasjoner, inkludert crowddsourcing og spillebaserte prosjekter.

Selv om den menneskelige protokollen nesten er universelt anvendelig, fokuserer den først på støtte fra desentraliserte markedsplasser i forbindelse med maskinlæring (ML). For å være mer presis, gjør den menneskelige protokollen det lettere å registrere enorme mengder av menneskelige kommentardata av høy kvalitet mens du opprettholder optimale servicenivåer.

Mens den menneskelige protokollen opprinnelig dukket opp fra Hcaptcha, en av de mest populære og testede Captcha-tjenestene på Web 2.0, har plattformen siden etablert seg som en helt unik enhet ved å tilby den underliggende teknologien for å støtte all-round-markeder der nesten alle oppgaver-inkluderende data identifikasjon-Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds Crowds.

Det menneskelige arbeidsmarkedet tilbyr for tiden video-, bilde- og teksthjelpsmarkeder som kjøpere og selgere blir samlet på. Den underliggende protokollen kan dele en jobb (oppgave) til mange av disse markedene og sende den til de tilsvarende børsene (applikasjonene som arbeiderne bruker for å gjøre jobben). I tillegg kan det motvirke dataene på alle jobbmarkeder for å sikre kvalitet.

I tillegg har Human Protocol-teamet valgt de beste tilgjengelige verktøyene for hvert arbeidsmarked. De har utviklet utvekslingene og optimaliserer dem kontinuerlig for å tilby ansatte alt de trenger for å fullføre de forespurte oppgavene. Protokollen inneholder også verktøy som opprettholder en ende-til-ende kvalitetskontroll over de overførte jobbene. Dette betyr effektivt at forespørsler får et mer deterministisk resultat hvis lignende jobber utføres omtrent samme utveksling.

Tross alt tilbyr Human Protocol en helt åpen løsning sammenlignet med sterkt sentraliserte og mikrostyrte plattformer, som gjør det mulig for en rekke prosjekter å bruke infrastrukturen. I tillegg tilbyr det også muligheten til å hjelpe prosjekter til å legge til dine egne verktøy for å oppfylle kravene til datasikring mer presist, effektivt og uten mellomhandlere. Det viktigste er at oppføringen, distribusjonen og godtgjørelsen av jobber automatiseres i tillegg til millioner av mikrobetalinger, takket være anvendelsen av blockchain-teknologien til protokollen, for å lette transaksjoner og fakturering for ordnet, pålitelig og rettferdig måte.

Kommentare (0)