يعيد البروتوكول البشري تعريف السوق لتمييز البيانات والتعهيد الجماعي لتحقيق دقة أفضل
يعيد البروتوكول البشري تعريف السوق لتمييز البيانات والتعهيد الجماعي لتحقيق دقة أفضل
يمكن للذكاء الاصطناعي (AI) تحقيق غرضه فقط إذا تم تدريبه على بيانات عالية الجودة. يعتمد نجاح خوارزمية AI إلى حد كبير على جودة وكمية بيانات التدريب المستخدمة. وفقًا لذلك ، لا ينبغي أن يفاجئ تواجه معظم مشاريع الذكاء الاصطناعي المهمة الصعبة المتمثلة في جمع أو شراء بيانات عالية الجودة. هناك العديد من الحالات التي تنتهي فيها المشاريع ببيانات منخفضة الجودة أو بيانات ملحوظة. في حين تم إنشاء العديد من خدمات تحديد البيانات في السنوات الأخيرة التي تواجه التحدي إلى حد ما ، فإنها تعاني من مشاكلهم الخاصة. الأسباب الرئيسية لبيانات ملحوظة ذات جودة منخفضة ، على سبيل المثال ، الأشخاص أو العمليات أو التقنيات المستخدمة لوضع العلامات.
ولكن ما هي البيانات المسمى بالضبط؟
علامة البيانات: الوقود لنماذج الذكاء الاصطناعي
فيما يتعلق بـ AI ، تتعلق البيانات المحددة بالبيانات التي "تم وضع علامة أو تعليق" بحيث يمكن أن يتنبأ نموذج التعلم الآلي بالنتيجة المرجوة. بشكل عام ، تتضمن عملية تحديد البيانات بأكملها عدة خطوات ، مثل تعليق البيانات ، والتصنيف ، ووضع العلامات ، والاعتدال والمعالجة.
هناك عدة أساليب لوضع علامات على البيانات التي يمكن استخدامها بشكل مستقل عن بعضها البعض أو مجتمعة. ويشمل ذلك وضع علامة على البيانات الداخلية ، والاستعانة بمصادر خارجية ، والاستعانة بمصادر خارجية واستخدام الآلات (حيث يتم تصنيف البيانات باستخدام خوارزميات التعلم الآلي).
اعتمادًا على تعقيد المشكلة ، غالبًا ما تستخدم مشاريع الذكاء الاصطناعي عمليات وضع علامات واسعة النطاق من أجل تحويل البيانات غير المسمى إلى بيانات التدريب التي تحتاجها لتدريس نماذج الذكاء الاصطناعي الخاصة بك ، والتي يمكن تحديدها لإنشاء الإصدار المطلوب.
من العديد من الأساليب المتاحة هي التعهيد الجماعي ، حيث يتم استخدام منصة طرف ثالث للوصول إلى كميات كبيرة من العمال البشريين في نفس الوقت ، أحد أكثر أساليب المشاريع استخدامًا لتحديد البيانات. في السنوات الأخيرة ، من بين أشياء أخرى ، ظهرت العديد من المنصات مثل Amazon Mturk و Appen Meeta Dash و Label Box و Tagog كبعض من منصات الواعدة للعاملين في مجال التعهيد الجماعي لتمييز البيانات.
However, several projects have expressed concerns about the data quality of crowdsourcing platforms. على سبيل المثال ، خذ مشكلة جودة البيانات مع Amazon Mechanical Turk (MTURK) ، والتي تعود إلى عام 2018. يشتبه العديد من باحثو البيانات في أن البيانات التي تستخدم برامج الروبوت بالإضافة إلى نصف رمز أو نصوص تلقائي بالكامل من أجل دعم الأشخاص في رد الفعل بسرعة على مجموعات البيانات معينة.
تم تعزيز جزء من المشكلة إلى المستخدمين من مواقع مختلفة استخدمت VPNs للمشاركة في الدراسات الاستقصائية والاستبيانات التي لم تكن مناسبة لمخطط منطقتهم. نظرًا لأن منصات التعهيد الجماعي تدفع العمال البشريين بشكل مناسب لاستكمال المهام ، غالبًا ما يشارك المستخدمون في أنشطة مزدوجة لتحقيق المزيد من الدخل. على سبيل المثال ، يمكن لعدد من المستخدمين من مختلف البلدان استخدام VPN للمشاركة في برنامج تعريف البيانات يتطلب بعض الإجابات من السكان الأمريكيين. هذا يؤدي إلى إجابات أقل شأنا وغير منطقية ، والتي بدورها تخفض جودة البيانات.
إذا تم تقديم بيانات ذات جودة منخفضة ، فإن هذا يثير أسئلة خطيرة حول عملية ضمان الجودة الحالية. نظرًا لأن معظم منصات التعهيد الجماعي الحالي لتحديد البيانات مركزية بقوة ، يكاد يكون من المستحيل تقييم الجودة وسير العمل. كل هذه المشكلات ، المقترنة بنمو تشبه المذنب لتكنولوجيا blockchain ، قد مهدت الطريق لحلول التعهيد الجماعي اللامركزية وخالية من الموافقة.
هنا يقدم البروتوكول البشري نهجًا جديدًا جديدًا لوضع علامات على البيانات من خلال إنشاء بنية تحتية تدعم أسواق العمل بدون إذن التي توفر للعمال البشريين أيضًا عملًا ويمنح المنظمات الوصول إلى العمال-بدون وسيط مركزي.
بطبيعة الحال ، فإن البروتوكول البشري عبارة عن بنية تحتية مفتوحة المصدر غير مركزية والأوتوماتيكية والتي توفر إطارًا هجينًا لتنظيم وتقييم وتقييم العمل البشري. يخدم البروتوكول البشري مصالح الموظفين وأصحاب العمل. نتيجة لذلك ، يمكن استخدامه في مجموعة متنوعة من التطبيقات ، بما في ذلك التعهيد الجماعي والمشاريع القائمة على أزعج. على الرغم من أن البروتوكول البشري قابل للتطبيق عالميًا تقريبًا ، إلا أنه يركز أولاً على دعم الأسواق اللامركزية فيما يتعلق بالتعلم الآلي (ML). لكي تكون أكثر دقة ، يجعل البروتوكول البشري من السهل تسجيل كميات هائلة من بيانات التعليقات البشرية عالية الجودة مع الحفاظ على مستويات الخدمة المثلى. في حين ظهر البروتوكول البشري في الأصل من HCAPTCHA ، واحدة من أكثر خدمات CAPTCHA شعبية واختبارها على الويب 2.0 ، فقد أنشأت المنصة منذ ذلك الحين كوحدة فريدة تمامًا من خلال تقديم التكنولوجيا الأساسية لدعم أسواق جميع الأدوار التي تكادها تقريبًا تحديد بيانات البيانات. يقدم سوق العمل البشري حاليًا أسواق الفيديو والصور والنصوص التي يتم تجميع المشترين والبائعين. يمكن للبروتوكول الأساسي تقسيم الوظيفة (المهمة) إلى العديد من هذه الأسواق وإرسالها إلى البورصات المقابلة (التطبيقات التي يستخدمها العمال للقيام بالمهمة). بالإضافة إلى ذلك ، يمكنه مواجهة البيانات على جميع أسواق الوظائف لضمان الجودة. بالإضافة إلى ذلك ، اختار فريق البروتوكول البشري أفضل الأدوات المتاحة لكل سوق عمل. لقد طوروا البورصات وحسنها باستمرار لتزويد الموظفين بكل ما يحتاجون إليه لإكمال المهام المطلوبة. يحتوي البروتوكول أيضًا على أدوات تحافظ على مراقبة الجودة الشاملة على الوظائف المنقولة. هذا يعني بشكل فعال أن الطلبات تتلقى نتيجة أكثر حتمية إذا تم تنفيذ وظائف مماثلة حول نفس التبادل. بعد كل شيء ، يقدم البروتوكول البشري حلاً مفتوحًا تمامًا مقارنةً بالمنصات المركزية والمدارة الدقيقة القوية ، والتي تمكن مجموعة متنوعة من المشاريع من استخدام بنيتها التحتية. بالإضافة إلى ذلك ، فإنه يوفر أيضًا إمكانية مساعدة المشاريع على إضافة أدواتك الخاصة لتلبية متطلبات وصف البيانات بشكل أكثر دقة وكفاءة وبدون تجار وسيطة. أهم شيء هو أن إدراج وتوزيع ومكافحة الوظائف مؤتمتة بالإضافة إلى ملايين المدفوعات الصغيرة ، وذلك بفضل تطبيق تقنية blockchain للبروتوكول ، لتسهيل المعاملات والفواتير للطريقة المنظمة والموثوقة والمنصفية.
تسهيل أسواق الوظائف المجانية للموافقة
Kommentare (0)