تقسيم أي شيء، الذي نشرته مؤخرًا Facebook Research ، يفعل شيئًا وجده معظم الأشخاص الذين انغمسوا في رؤية الكمبيوتر أمرًا شاقًا: معرفة موثوقة أي وحدات البكسل في الصورة تنتمي إلى كائن. جعل هذا أسهل هو الغرض من نموذج Segment Anything Model (SAM) ، والذي تم إصداره مؤخرًا بموجب ترخيص Apache 2.0.
النتائج تبدو رائعة ، وهناك العرض التفاعلي متاح حيث يمكنك اللعب بالطرق المختلفة التي يعمل بها SAM. يمكن تحديد الكائنات من خلال التأشير على صورة والنقر عليها ، أو يمكن تقسيم الصور تلقائيًا. بصراحة ، من المثير للإعجاب رؤية SAM يجعل إخفاء الكائنات المختلفة في الصورة يبدو بلا مجهود. ما يجعل هذا ممكنًا هو التعلم الآلي ، وجزء من ذلك هو حقيقة أن النموذج وراء النظام قد تم تدريبه على مجموعة بيانات ضخمة من الصور والأقنعة عالية الجودة ، مما يجعله فعالًا للغاية في ما يفعله.
بمجرد تقسيم الصورة ، يمكن استخدام هذه الأقنعة للتفاعل مع أنظمة أخرى مثل التعرف على الأشياء (التي تحدد وتسمي ماهية الكائن) وتطبيقات رؤية الكمبيوتر الأخرى. يعمل مثل هذا النظام بشكل أقوى إذا كانوا يعرفون بالفعل أين يبحثون ، بعد كل شيء. هذا مشاركة مدونة من Meta AI انتقل إلى مزيد من التفاصيل حول ما هو ممكن مع SAM ، وستتوفر تفاصيل أكثر العمل البحثي.
تعتمد هذه الأنظمة على مجموعات بيانات عالية الجودة. بالطبع ، لا شيء يتفوق على مجموعة كبيرة من بيانات العالم الحقيقي ، لكننا رأينا أيضًا أنه من الممكن إنشاء بيانات لم تكن موجودة من قبل ، والحصول على نتائج مفيدة.
“Social media addict. Zombie fanatic. Travel fanatic. Music geek. Bacon expert.”