Det mänskliga protokollet omdefinierar marknaden för datamarkering och crowdsourcing för att uppnå bättre noggrannhet
Det mänskliga protokollet omdefinierar marknaden för datamarkering och crowdsourcing för att uppnå bättre noggrannhet
Artificial Intelligence (AI) kan endast uppfylla sitt syfte om det utbildas på data av hög kvalitet. Framgången för en AI -algoritm beror till stor del på kvaliteten och mängden av de utbildningsdata som används. Följaktligen bör det inte överraska Skapandet av ett AI-projekt ägnas åt optimering av träningsdata
De flesta AI-projekt står inför den svåra uppgiften att samla in eller köpa data av hög kvalitet. Det finns flera fall där projekt ofta slutar med data av låg kvalitet eller markerade data. Medan flera dataidentifieringstjänster har skapats under de senaste åren som står inför utmaningen i viss utsträckning, har de sina egna problem. De främsta orsakerna till markerade data om låg kvalitet är till exempel människor, processer eller tekniker som används för märkning.
Men vad är exakt märkta data?
Datamarkering: bränslet för AI-modeller
I samband med AI hänför sig markerade data till data som är "markerade eller kommenterade" så att en maskininlärningsmodell kan förutsäga önskat resultat. I allmänhet innehåller hela dataidentifieringsprocessen vanligtvis flera steg, till exempel datakommentarer, klassificering, taggning, måttlighet och bearbetning.
Det finns flera metoder för datamärkning som antingen kan användas oberoende av varandra eller i kombination. Detta inkluderar intern datamarkering, outsourcing, crowdsourcing och användning av maskiner (varvid data är märkt med hjälp av maskininlärningsalgoritmer).
Beroende på komplexiteten i problemet använder AI-projekt ofta omfattande märkningsprocesser för att konvertera inte märkta data till träningsdata som du behöver för att lära dina AI-modeller, som kan identifieras för att skapa önskad utgåva.
Av de många tillgängliga metoderna är crowdsourcing, där en tredjepartsplattform används för att få tillgång till stora mängder mänskliga arbetare samtidigt, en av de mest använda taktikerna för projekt för att identifiera data. Under de senaste åren, bland annat, har flera plattformar som Amazon Mturk, Appen Meeta Dash, Label Box och Tagog dykt upp som några av de mest lovande plattformarna för folkmassor för människoarbetare för datamarkering.
Men flera projekt har uttryckt oro över datakvaliteten på crowdsourcing-plattformar. Ta till exempel datakvalitetsproblemet med Amazon Mechanical Turk (MTURK), som går tillbaka till 2018. Många dataforskare misstänker att data som använder bots utöver hälften och hela automatisk kod eller skript identifierades för att stödja människor i reaktionen snabbt på vissa datauppsättningar.
En del av problemet tillskrivs användare från olika platser som använde VPN: er för att delta i undersökningar och frågeformulär som inte var lämpliga för deras områdesprogram. Eftersom crowddsourcing -plattformar betalar mänskliga arbetare på lämpligt sätt för slutförandet av uppgifter, deltar användare ofta i dubbla aktiviteter för att uppnå mer inkomst. Till exempel kan ett antal användare från olika länder använda VPN för att delta i ett dataidentifieringsprogram som kräver vissa svar från amerikanska invånare. Detta leder till sämre och nonsensiska svar, vilket i sin tur sänker datakvaliteten.
Om data om låg kvalitet lämnas in, väcker detta allvarliga frågor om den befintliga kvalitetssäkringsprocessen. Eftersom de flesta befintliga crowdsourcing -plattformar för dataidentifiering är starkt centraliserade är det nästan omöjligt att bedöma kvaliteten och arbetsflödet. Alla dessa problem, i kombination med den kometliknande tillväxten av blockchain-teknik, har banat vägen för decentraliserade och godkännandefria crowdsourcing-lösningar.
Här presenterar det mänskliga protokollet en ny ny strategi för datamärkning genom att skapa en infrastruktur som stöder de tillståndslösa arbetsmarknaderna som också ger mänskliga arbetare arbete och ger organisationer tillgång till arbetare-alla utan centrala mellanhänder.
Det mänskliga protokollet är naturligtvis en decentraliserad och automatiserad open source-infrastruktur som erbjuder en hybridram för organisation, utvärdering och ersättning för mänskligt arbete. Det mänskliga protokollet tjänar både anställdas och arbetsgivarnas intressen. Som ett resultat kan det användas i en mängd olika applikationer, inklusive crowddsourcing och spelbaserade projekt. Även om det mänskliga protokollet nästan är universellt tillämpligt, fokuserar det först på stöd från decentraliserade marknadsplatser i samband med maskininlärning (ML). För att vara mer exakt gör det mänskliga protokollet det enklare att registrera enorma mängder av högkvalitativa mänskliga kommentardata samtidigt som de upprätthåller optimala servicenivåer. Medan det mänskliga protokollet ursprungligen dök upp från HCaptcha, en av de mest populära och testade CAPTCHA-tjänsterna på Web 2.0, har plattformen sedan etablerat sig som en helt unik enhet genom att erbjuda den underliggande tekniken för att stödja allround-marknader där nästan alla uppgifter-including-data identifiering-Crowdsourcing-tid. Den mänskliga arbetsmarknaden erbjuder för närvarande video-, bild- och textassistansmarknader som köpare och säljare samlas. Det underliggande protokollet kan dela upp ett jobb (uppgift) till många av dessa marknader och skicka det till motsvarande utbyten (de applikationer som arbetarna använder för att göra jobbet). Dessutom kan det motverka uppgifterna på alla jobbmarknader för att säkerställa kvalitet. Dessutom har Human Protocol-teamet valt de bästa tillgängliga verktygen för varje arbetsmarknad. De har utvecklat börserna och kontinuerligt optimera dem för att erbjuda anställda allt de behöver för att slutföra de begärda uppgifterna. Protokollet innehåller också verktyg som upprätthåller en kvalitetskontroll av slut till slut över de överförda jobben. Detta innebär effektivt att förfrågningar får ett mer deterministiskt resultat om liknande jobb utförs ungefär samma utbyte. Trots allt erbjuder mänskligt protokoll en helt öppen lösning jämfört med starkt centraliserade och mikrohanterade plattformar, vilket gör det möjligt för en mängd olika projekt att använda sin infrastruktur. Dessutom erbjuder det också möjligheten att hjälpa projekt att lägga till dina egna verktyg för att uppfylla kraven för datamärkning mer exakt, effektivt och utan mellanliggande återförsäljare. Det viktigaste är att listan, distributionen och ersättningen av jobb automatiseras utöver miljoner mikrobetalningar, tack vare tillämpningen av blockchain-tekniken för protokollet, för att underlätta transaktioner och fakturering för ordnat, pålitligt och rättvist sätt.
Underlätta godkännandefria jobbmarknader
Kommentare (0)