Il protocollo umano ridefinisce il mercato per la marcatura dei dati e il crowdsourcing per ottenere una migliore accuratezza
Il protocollo umano ridefinisce il mercato per la marcatura dei dati e il crowdsourcing per ottenere una migliore accuratezza
L'intelligenza artificiale (AI) può soddisfare il suo scopo solo se è addestrato su dati di alta qualità. Il successo di un algoritmo di intelligenza artificiale dipende in gran parte dalla qualità e dalla quantità dei dati di formazione utilizzati. Di conseguenza, non dovrebbe sorprendere La creazione di un progetto AI è dedicata all'ottimizzazione dei dati di addestramento
La maggior parte dei progetti di intelligenza artificiale si trova ad affrontare il difficile compito di raccogliere o acquistare dati di alta qualità. Esistono diversi casi in cui i progetti finiscono spesso con dati di bassa qualità o dati contrassegnati. Mentre negli ultimi anni sono stati creati diversi servizi di identificazione dei dati che affrontano la sfida in una certa misura, hanno i loro problemi. I motivi principali per dati contrassegnati a bassa qualità sono, ad esempio, le persone, i processi o le tecnologie utilizzate per l'etichettatura.
ma quali sono esattamente dati etichettati?
marcatura dei dati: il carburante per i modelli AI
; In generale, l'intero processo di identificazione dei dati di solito include diversi passaggi, come commenti sui dati, classificazione, etichettatura, moderazione ed elaborazione.Esistono diversi approcci all'etichettatura dei dati che possono essere utilizzati indipendentemente l'uno dall'altro o in combinazione. Ciò include la marcatura interna dei dati, l'outsourcing, il crowdsourcing e l'uso di macchine (per cui i dati sono etichettati utilizzando algoritmi di apprendimento automatico).
; ; Negli ultimi anni, tra le altre cose, diverse piattaforme come Amazon Mtuk, Appen Meeta Dash, Label Box e Tagog sono emerse come alcune delle piattaforme più promettenti per i lavoratori umani crowdsourcing per la marcatura dei dati.Tuttavia, diversi progetti hanno espresso preoccupazione per la qualità dei dati delle piattaforme di crowdsourcing. Ad esempio, prendere il problema della qualità dei dati con Amazon Mechanical Turk (MTurk), che risale al 2018. Molti ricercatori di dati sospettano che i dati che utilizzano bot oltre alla metà e al codice o agli script completamente automatici siano stati identificati al fine di supportare le persone nella reazione rapidamente a alcuni set di dati.
Parte del problema è stata attribuita agli utenti di diverse posizioni che utilizzavano VPN per partecipare a sondaggi e questionari che non erano adatti al loro schema di area. Poiché le piattaforme di crowdsourcing pagano i lavoratori umani in modo appropriato per il completamento delle attività, gli utenti spesso partecipano a doppie attività per ottenere più reddito. Ad esempio, alcuni utenti di diversi paesi possono utilizzare VPN per partecipare a un programma di identificazione dei dati che richiede alcune risposte dai residenti americani. Ciò porta a risposte inferiori e senza senso, che a loro volta riducono la qualità dei dati.
Se vengono inviati dati di bassa qualità, ciò solleva serie domande sul processo di garanzia della qualità esistente. Poiché la maggior parte delle piattaforme di crowdsourcing esistenti per l'identificazione dei dati sono fortemente centralizzate, è quasi impossibile valutare la qualità e il flusso di lavoro. Tutti questi problemi, abbinati alla crescita simile alla cometa della tecnologia blockchain, hanno aperto la strada a soluzioni di crowdsourcing decentralizzate e prive di approvazione.
;Facilitazione dei mercati del lavoro senza approvazione
; Il protocollo umano serve sia gli interessi dei dipendenti che dei datori di lavoro. Di conseguenza, può essere utilizzato in una varietà di applicazioni, tra cui crowdsourcing e progetti basati su concerti.Sebbene il protocollo umano sia quasi universalmente applicabile, si concentra prima sul supporto di mercati decentralizzati in relazione all'apprendimento automatico (ML). Per essere più precisi, il protocollo umano rende più facile registrare enormi quantità di dati di commento umano di alta qualità mantenendo livelli di servizio ottimali.
Mentre il protocollo umano emerse originariamente da HCAPTCHA, uno dei servizi captcha più popolari e testati su Web 2.0, la piattaforma si è stabilita come un'unità completamente unica offrendo la tecnologia sottostante a supportare i mercati a tutto tondo in cui quasi tutti i dati identificativi in inclusione-Crowddorcing.
; Il protocollo sottostante può dividere un lavoro (attività) con molti di questi mercati e inviarlo agli scambi corrispondenti (le applicazioni che i lavoratori usano per fare il lavoro). Inoltre, può contrastare i dati su tutti i mercati del lavoro per garantire la qualità.Inoltre, il team del protocollo umano ha selezionato i migliori strumenti disponibili per ogni mercato del lavoro. Hanno sviluppato gli scambi e ottimizzarli continuamente per offrire ai dipendenti tutto il necessario per completare le attività richieste. Il protocollo contiene anche strumenti che mantengono un controllo di qualità end-to-end sui lavori trasmessi. Ciò significa effettivamente che le richieste ricevono un risultato più deterministico se vengono eseguiti lavori simili circa lo stesso scambio.
; Inoltre, offre anche la possibilità di aiutare i progetti ad aggiungere i propri strumenti per soddisfare i requisiti per l'etichettatura dei dati in modo più preciso, efficiente e senza rivenditori intermedi. La cosa più importante è che l'elenco, la distribuzione e la remunerazione dei lavori siano automatizzati oltre a milioni di micro-pagamenti, grazie all'applicazione della tecnologia blockchain del protocollo, per facilitare le transazioni e la fatturazione per un modo ordinato, affidabile ed equo.
Kommentare (0)