في مثل هذا الوقت من العام الماضي ، اشتعلت النيران في وسائل التواصل الاجتماعي بفضل تقنية MyHeritage’s Deep Nostalgia الفيروسية ، والتي قام سحرة الذكاء الاصطناعي بها بتحريك صور عائلتنا القديمة بواقعية مزعجة. حسنًا ، إذا شعرت بالخوف من هذا الأمر ، فانتظر حتى ترى الميزة الجديدة التي تم إطلاقها للتو LiveStory.
هذه المرة ، لا تنشئ تقنية شركة الأنساب عبر الإنترنت مقطعًا صغيرًا من 10 إلى 20 استنادًا إلى صورة قديمة لقريبك. بدلاً من ذلك ، يذهب LiveStory إلى أبعد من ذلك من خلال إنشاء مقطع فيديو متحرك أطول لسلفك يروي القصة الكاملة لحياته ، مع صوت متزامن مع الشفاه وعرض شرائح للصور القديمة.
كما كان من قبل ، يعمل هذا عن طريق استخدام تقنية “إعادة التشريع” المدعومة بالذكاء الاصطناعي والتي تحيي صورة وجه قريبك. ولكن هذه المرة أيضًا تحصل على صوت يتم إنشاؤه تلقائيًا من شجرة عائلة MyHeritage أو يتم إدخاله يدويًا. تعمل تقنية تحويل النص إلى كلام على إضفاء الحيوية على القصة وتتم مزامنة الصوت مع الرأس الناطق المتحرك لقريبك.
كيف يعمل هذا؟
مثل تقنية الحنين العميق للعام الماضي ، يتم إنشاء الرسوم المتحركة في LiveStory باستخدام مجموعة كبيرة من “مقاطع فيديو السائق”. بمجرد أن تقوم خوارزميات الخدمة بتحليل الصورة التي قمت بتحميلها ، يتم تعيين ميزاتها البارزة أو “معالم” الوجه على فيديو السائق لخلق انطباع بالحركة. تملأ الخوارزميات أيضًا جميع التفاصيل المفقودة. ينشئ مُنشئ الصوت الاصطناعي السرد بناءً على معلومات حول ملف تعريف الشخص ، أو يمكنك إنشاء نص خاص بك من البداية. يمكنك أيضًا تحميل التسجيل الصوتي الخاص بك.
تقول MyHeritage و D-ID ، الشركة الإسرائيلية التي تبتكر التكنولوجيا وترخصها ، إن النتيجة النهائية قابلة للتخصيص بالكامل ، مما يمنحك القدرة على تغيير السرد والصور والصوت قبل إرسالها إلى العائلة أو الشبكات الاجتماعية. يبدو أن LiveStory يدعم أيضًا 31 لغة وعشرات اللهجات ومئات الشخصيات الصوتية ، إلى جانب خيارات صوتية مختلفة للذكور والإناث.
على الرغم من كل هذا ، ليس هناك شك في أن التكنولوجيا تقشعر لها الأبدان قليلاً وتأخذنا في رحلة أكبر إلى الوادي المذهل. بالنسبة للبعض ، فإن إضافة الصوت قد تستغرق وقتًا طويلاً ، وكان على MyHeritage إضافة بعض التحذيرات لضمان عدم إساءة استخدام التكنولوجيا. ويقول إن LiveStory “مخصص فقط لصور الموتى ، وعادة أسلاف الإنسان نفسه” وأنه “لا ينبغي استخدامه على صورة شخص على قيد الحياة دون إذنه”.
ومع ذلك ، وجد الكثير على وسائل التواصل الاجتماعي أن تقنية “الحنين العميق” في العام الماضي كانت وسيلة مريحة أو حتى دافئة للقلب “لمقابلة” علاقات لم يروها من قبل في الحياة الواقعية. ومثل هذه الميزة ، فإن LiveStory مجاني حاليًا للتجربة على سطح المكتب أو الإنترنت عبر الهاتف المحمول (كلاهما عبر موقع MyHeritage الإلكتروني) وتطبيق الجوال MyHeritage. يمكنك إنشاء قصص LiveStories متعددة مجانًا ، ولكن بعد ذلك سيتعين عليك الدفع مقابل اشتراك (من 119 دولارًا / 89 جنيهًا إسترلينيًا سنويًا).
التحليل: خطوة أكثر جرأة في الوادي المذهل
تمامًا مثل العام الماضي “Deep Nostalgia” ، نحن ممزقون قليلاً بشأن الميزة الجديدة لـ MyHeritage “LiveStory”. ليس هناك شك في أن التكنولوجيا رائعة ، وحقيقة أنها يمكن أن تنشئ تلقائيًا سيرة فيديو مدتها 90 ثانية لصورة وشجرة عائلة وأي نص هو أمر مثير للإعجاب ومخيف.
ومع ذلك ، لا يسعنا إلا أن نشعر بأن الكثير من النجاح الفيروسي السابق للتكنولوجيا (الذي أدى إلى 100 مليون رسم متحرك) اعتمد على دقتها. كانت الوجوه المتحركة التي أنتجتها “Deep Nostalgia” تومض أحيانًا أو تميل رؤوسها ، لكن هذا كل شيء – وقد ساعد هذا التقييد في خلق وهم أثناء إخفاء قيود التكنولوجيا.
تعد إضافة الصوت خطوة معقولة ، وليس لدينا شك في أنها ستثبت أنها أداة شائعة لأولئك الذين لا يصابون بقشعريرة من عامل الزحف الذي لا يمكن إنكاره. ولكن من الأمثلة التي رأيناها حتى الآن ، فإن التنغيم يكون أحيانًا آليًا وحقيقة أن الصوت لا يتم أخذ عينات من الشخص الأصلي يجعله مصطنعًا بعض الشيء.
في الوقت الحالي ، يبدو أن LiveStory أكثر ملاءمة للمتاحف أو التعليم ، حيث يمكن أن تكون قدرته على جلب الشخصيات التاريخية (بدلاً من الروابط الشخصية) إلى الحياة طريقة مفيدة لجعل التاريخ أكثر جاذبية للزوار والأطفال.
بالطبع ، هناك أيضًا احتمال لسوء الاستخدام ، على الرغم من أن D-ID (صانع التكنولوجيا) قد أنشأ بعض الدرابزين لمنع ذلك. يجب منح جميع المستخدمين شروطًا ، بما في ذلك الوعد بأنهم لن يستخدموها مع أشخاص أحياء ، قبل أن يتمكنوا من إنشاء LiveStory. هناك أيضًا خوارزمية لإدارة النص على متن الطائرة للتحقق مما إذا كانت هناك معلومات مسيئة أو تشهيرية أو خاطئة ، على الرغم من أنه ليس من الواضح كيف يتم التحقق من هذه الأخيرة.
متى تحدثنا إلى D-ID العام الماضي في مقابلة حصرية، لقد تأثرنا بالتزامها بالتأكد من عدم استغلال تقنية الذكاء الاصطناعي الخاصة بها بطرق شريرة ، حتى لو انزعجنا قليلاً من توقعها أن معظم الوسائط المرئية التي نراها على الإنترنت ستكون اصطناعية “في غضون 5-10 سنوات”. LiveStory هي بلا شك خطوة أخرى في هذا الاتجاه ، إذا لم يكن الانفجار الفيروسي الذي حدث في العام الماضي هو “الحنين العميق”.
“Social media addict. Zombie fanatic. Travel fanatic. Music geek. Bacon expert.”