بناء MEEMES: تبديل الشخصيات مقابل تبديل الوجه

لقد بدأت في إنشاء MEEMES لأنني كنت محبطًا. عملت كل أداة لتبديل الوجه التي جربتها بشكل رائع في العروض التوضيحية - عندما بدا الشخص الموجود في الميم مشابهًا للشخص الذي يتم تبديله. ولكن في اللحظة التي كان هناك عدم تطابق في لون البشرة أو الجنس أو بنية الوجه؟ وتراوحت النتائج من محرج إلى مقلق حقا.
هذه ليست مشكلة متخصصة. هذا هو حال معظم الناس، في معظم الأوقات.
مشكلة تبديل الوجه التقليدي
تقوم تقنية تبديل الوجه التقليدية بما تقوله تمامًا - فهي تأخذ وجهًا وتلصقه على وجه آخر. يحاول الذكاء الاصطناعي مزج ألوان البشرة ومطابقة الإضاءة، لكنه محدود بشكل أساسي. إنها تحاول جعل وجهك ملائمًا للمساحة التي تم تشكيلها من خلال بنية عظام شخص آخر ولون بشرته وميزاته.
يعمل هذا بشكل جيد عندما يكون التبادل بين أشخاص متشابهين المظهر. لكن حاول تبديل وجه امرأة بقالب ميم ذكري، أو أي مبادلة حيث يكون هناك اختلاف كبير في لون البشرة، وستحصل على... مشاكل. أشياء الوادي غريبة. نوع النتائج التي لا ترغب بالتأكيد في مشاركتها.
أدخل تبديل الأحرف
لذا قمنا ببناء شيء مختلف. بدلاً من مجرد تبديل الوجوه، يقوم برنامج تبادل الشخصيات الخاص بنا بإعادة تصور الشخصية بأكملها. فهو لا يحاول مزج وجهك برأس شخص آخر، بل يعيد إنشاء المشهد معك كشخصية.
الفرق دقيق ولكنه هائل. لون بشرتك يبقى لون بشرتك. إن بنية وجهك تُعلم الشخصية بأكملها، وليس فقط الوجه المُلصق. تبدو النتيجة وكأنك تنتمي بالفعل إلى هذا الميم، لأن الذكاء الاصطناعي لا يحارب عدم التطابق - إنه يبني من حولك.
متى يتم استخدام أي منها
احتفظنا بالخيارين لأن لكل منهما مكانه:
تبديل الوجه الثابت أسرع ويعمل بشكل رائع عندما تقوم بالتبديل إلى صورة ميمي حيث يكون الوجه الأصلي مشابهًا لوجهك - لون بشرة مماثل، عرض مماثل للجنس، بنية وجه مماثلة. كما أنه أفضل للحفاظ على التعبيرات الدقيقة من الميم الأصلي.
تبديل الأحرف هو ما تريده عندما يكون هناك أي اختلاف كبير بينك وبين قالب الميم. لون بشرة مختلف؟ مبادلة الأحرف. جنس مختلف؟ مبادلة الأحرف. الميم الأصلي له شكل وجه مختلف تمامًا؟ مبادلة الأحرف. تستغرق المعالجة وقتًا أطول قليلاً، لكن النتائج تستحق العناء.
الحصول على أفضل النتائج
أيًا كان الوضع الذي تستخدمه، هناك شيئان يحدثان أكبر فرق في جودة الإخراج: الصورة المصدر والميم الذي تختاره.
صورتك المصدرية مهمة (كثيرًا)
لا يمكن للذكاء الاصطناعي أن يعمل إلا مع ما تقدمه له. ستؤدي الصورة الباهتة أو الداكنة أو المحجوبة جزئيًا إلى نتائج ضبابية وغريبة. وإليك ما يعمل في الواقع:
أنت فقط في الإطار. الصور الجماعية تربك الذكاء الاصطناعي بشأن الوجه الذي يجب استخدامه. حتى لو كان وجهك هو الأكبر، يمكن للوجوه الأخرى في الصورة أن تتداخل مع الاكتشاف والتوليد. قم بقصها أو استخدم صورة مختلفة.
تعبير محايد. أعلم، أعلم - صورتك الضاحكة رائعة. لكن بالنسبة لتبديل الوجه، فإن الابتسامة المحايدة أو الخفيفة هي الأفضل. التعبيرات المتطرفة (فم مفتوح على مصراعيه، عيون محدقة، وما إلى ذلك) لا تنتقل بشكل جيد لأن الميم المستهدف له تعبيره الخاص الذي يجب أن يظهر.
لا يوجد نظارات شمسية. يبدو هذا واضحًا ولكني أتلقى ما يكفي من رسائل البريد الإلكتروني للدعم لأعلم أنه ليس كذلك. يحتاج الذكاء الاصطناعي إلى رؤية عينيك. النظارات الشمسية، ونظارات التزلج، وسماعات الواقع الافتراضي - لا شيء من هذا يعمل. النظارات العادية عادة ما تكون جيدة.
إضاءة جيدة أمامية. ضوء طبيعي أو صور داخلية مضاءة جيدًا. واجه الكاميرا. يمكن أن تعمل الملفات الجانبية ولكنك تجعل الأمر أصعب مما ينبغي.
اختيار قالب الميم المناسب
لم يتم إنشاء جميع الميمات بشكل متساوٍ بالنسبة لتبديل الوجه. يؤثر القالب الذي تختاره على نتائجك بقدر ما يؤثر على صورتك المصدر.
دقة أعلى = نتائج أفضل. تلك الميم المقرمشة المقلية التي تم التقاط لقطة شاشة لها وإعادة تحميلها 47 مرة؟ الذكاء الاصطناعي يكافح معها. ابحث عن إصدارات أنظف من القوالب عندما يكون ذلك ممكنًا. يحتوي Tenor عادةً على إصدارات جيدة الجودة من الميمات الشائعة.
الوجوه الواضحة والمرئية هي الأفضل. إذا كان الوجه الموجود في الميم صغيرًا أو محجوبًا بشدة أو بزاوية قصوى أو مغطى بطلاء للوجه/أسلوب ثقيل، فستكون النتائج غير متسقة. الكلاسيكيات هي كلاسيكيات لسبب ما - دريك، والصديق المشتت، والميمات التفاعلية ذات التعبيرات الواضحة.
صور GIF ذات وجوه ثابتة. بالنسبة إلى الميمات المتحركة، فإن الميمات التي تعمل بشكل أفضل تتمتع بوضع ثابت نسبيًا للوجه. الحركات الدقيقة (الوميض، دوران الرأس الصغير) جيدة. ستؤدي حركات الكاميرا الجامحة أو القطع السريع بين الزوايا أو التشوه الشديد للوجه إلى نتائج أكثر خشونة.
ما هي الخطوة التالية
ما زلنا نبني بنشاط. يتحسن نموذج تبديل الأحرف مع كل تكرار، ونحن نعمل على جعل المعالجة أسرع دون التضحية بالجودة. هناك أيضًا بعض الأشياء المثيرة للاهتمام حول مقايضات الشخصيات المتحركة - مع اتباع نهج إعادة التصور ولكن بالنسبة لصور GIF.
إذا كانت لديك تعليقات أو مشكلات، فأخبرني بذلك. بدأ الأمر برمته لأن الأدوات الموجودة لم تكن مناسبة للجميع. إن التأكد من أن MEEMES يعمل بالفعل من أجل الجميع هو بيت القصيد.
جربه بنفسك
أفضل طريقة لمعرفة الفرق هي تجربة كليهما. استخدم Face Swap لإجراء مقايضات سريعة مشابهة لما شابه، تبديل الأحرف عندما تحتاج إلى شيء يشبهك بالفعل. كلاهما متاح الآن - لا حاجة للتسجيل لتجربته.
