
يأتي إنشاء موقع ويب جديد مصحوبًا بقائمة من الأشياء التي تحتاجها والتي لم تضعها في الاعتبار بشكل كامل عندما بدأت. ينسخ. أيقونات. الرسوم التوضيحية. لقطات من دراسة الحالة. وصور الفريق .
صور الفريق هي واحدة من تلك الأشياء التي تبدو بسيطة وتبين أنها ليست كذلك. الحصول على كل عضو في الفريق في نفس المكان، ونفس الإضاءة، ونفس الإطار، في يوم يناسب الجميع، مع مصور فوتوغرافي يفهم الجمالية التي تبحث عنها - إنه تحدي تنسيق يستغرق أسابيع للجدولة وميزانية تتراكم بسرعة في اللحظة التي تريد فيها شيئًا يبدو مميزًا حقًا بدلاً من القصاصات الفنية الخاصة بالشركة.
كانت لدينا مشكلة مختلفة علاوة على ذلك. يتم توزيع فريقنا – بعض الأعضاء في دبي، والبعض الآخر يعملون عن بعد. لم تكن عملية التصوير المنسقة الواحدة عملية. لذلك فعلنا ما سيفعله أي فريق يقوم ببناء منتج رقمي في عام 2026: وجدنا طريقة أفضل.
لقد أنشأنا صورًا لفريقنا باستخدام الذكاء الاصطناعي. والنتائج هي في الواقع بعض من أفضل صور الفريق التي قمنا بإنتاجها.
وإليك بالضبط كيف فعلنا ذلك.
لم تكن نقطة البداية شيئًا كتبناه من الصفر. لقد وجدنا قاعدة قوية للمطالبة على Threads — النظام الأساسي للنصوص في Instagram — من شخص كان يقوم بتجربة إنشاء الصور الشخصية. كان للموجه العناصر الصحيحة: إضاءة الاستوديو الدرامية، والخلفية السوداء عالية التباين، وأسلوب الصورة التحريرية.
لكنها كانت بحاجة إلى العمل. لقد أخذناها إلى نموذج Grok — نموذج xAI — لتحسين البنية، وشحذ اللغة، وجعل القيود أكثر وضوحًا. يعتبر Grok جيدًا بشكل خاص في الهندسة السريعة وساعدنا في تشديد قسم تثبيت الهوية، وهو الجزء الأكثر أهمية في أي موجه صورة. يخبر مرساة الهوية النموذج بالضبط بما يجب الحفاظ عليه من الصورة المرجعية - ملامح الوجه، ولون البشرة، وتصفيفة الشعر، والبنية - بحيث يبدو الناتج مثل الشخص الفعلي وليس شخصًا غريبًا وسيمًا بشكل عام يرتدي معطفًا جميلًا.
بعد تحسين المطالبة في Grok، اختبرنا المخرجات في كل من ChatGPT (إنشاء صور GPT-4o) وGoogle Gemini. كلاهما حقق نتائج قوية. كانت مخرجات ChatGPT تتمتع بجودة سينمائية أكثر قليلاً - كانت إضاءة الحافة أكثر وضوحًا، وكان نسيج القماش على المعطف أكثر إقناعًا، وشعر تكامل الطباعة JOYBOY في الخلفية بمزيد من الحل. انتهى بنا الأمر باستخدام ChatGPT للصور النهائية.
هذه هي المطالبة الكاملة، تمامًا كما استخدمناها:
أنت مصور بورتريه تحريري عالمي متخصص في إضاءة الاستوديو الدرامية عالية التباين. أنشئ صورة بطولية قوية وديناميكية.
مرتكز الهوية (قيد صارم): استخدم الشخص المحدد من الصورة المرجعية المرفقة. الحفاظ على ملامح الوجه الدقيقة، ولون البشرة، وتصفيفة الشعر، وبنية الوجه، والمظهر الطبيعي دون تغيير تمامًا. قم بتطبيق الإضاءة والزاوية على هذا الموضوع المحدد.
خزانة الملابس والتصميم: _الملابس: معطف أسود فاخر ذو قصة حادة ومصممة خصيصًا. يجب أن يكون المعطف مصنوعًا من الصوف الأسود غير اللامع أو نسيج يشبه الكشمير مع تفاصيل قماشية دقيقة وخطوط نظيفة. اللون: أسود مطفي عميق. التعبير: جاد ومكثف ومركّز. ينظر الهدف بعيدًا عن الكاميرا إلى المساحة الموجودة بالأعلى وإلى الجانب قليلًا، وليس مباشرة نحو العدسة.
المشهد والتركيب: الخلفية: أسود نقي غير لامع AMOLED، صلب تمامًا وسلس، بدون تدرجات أو أنماط أو نسيج - أسود عميق مطلق للحصول على أقصى قدر من التباين. نص علامة تجارية كبير مدمج في الخلفية: كلمة "JOYBOY" بخط كبير جدًا وعريض وبسيط من نوع sans-serif، موضوعة خلف الموضوع. يجب أن يكون النص مرئيًا بمهارة خلال الظلام - ويتم تقديمه باللون الرمادي الفحمي الداكن جدًا أو الأبيض الفاتح الخافت مع عتامة منخفضة بحيث يبدو أنيقًا ومتكاملًا بدلاً من أن يكون طاغيًا. يجب أن تكون الطباعة حديثة ومتميزة ومعمارية، مع تباعد كبير بين الأحرف. زاوية الكاميرا (حرجة): لقطة قوية بزاوية منخفضة (النظر إلى الأعلى) لجعلها تبدو قوية ومهيمنة وبطولية. التأطير: لقطة مقربة متوسطة، تركز بشدة على الوجه والكتفين، مع وجود نص كبير "JOYBOY" يؤطر التكوين خلفهما.
الإضاءة (دراماتيكية وعالية التباين): لوحة الألوان: إضاءة عالية التباين مع ألوان سوداء عميقة وإبرازات ساطعة. الضوء الرئيسي: ضوء رئيسي قوي وموجه من أعلى اليسار أو أعلى اليمين، مما يخلق ظلالاً درامية تشيروسكورو تنحت وتبرز بنية الوجه وخط الفك وعظام الخد. إضاءة الحافة: ضوء حافة/حافة قوي وواضح يفصل بشكل واضح رأس الهدف وكتفيه عن الخلفية السوداء العميقة، مما يعطي مخططًا متوهجًا. الملء: من الحد الأدنى إلى لا شيء - حافظ على المزاج العام مظلمًا ومكثفًا. المزاج: غامض، مكثف، واثق، ومتميز. استديو سينمائي جمالي ذو شكل ثلاثي الأبعاد قوي.
الجودة الفنية: النمط: واقعي للغاية، ومفصل للغاية، ودقة 8K. التركيز: حاد للغاية على العينين والوجه، مع الحفاظ على مسام البشرة الطبيعية وملمسها. _ المعطف: نسيج من القماش الأسود اللامع المتطور مع تفاصيل خياطة دقيقة وخطوط منظمة نظيفة._ بشكل عام: صورة تحريرية نظيفة وحديثة وفاخرة مع أقصى قدر من التباين مع الخلفية السوداء النقية AMOLED ونص "JOYBOY" الكبير والدقيق.
المطالبة طويلة – عمدا. المطالبات الغامضة تنتج نتائج غامضة. يعمل كل قسم من هذه المطالبة على حل مشكلة محددة: يمنع مرساة الهوية النموذج من إنشاء وجه عام، وتمنع تعليمات الخلفية السوداء AMOLED النزيف المتدرج، وينشئ اتجاه الكاميرا ذات الزاوية المنخفضة الإطار البطولي الذي يميز هذه الصور الشخصية عن لقطات الرأس القياسية، وتنتج مواصفات ضوء الحافة فصلًا نظيفًا للحافة مما يجعل الهدف يظهر على الخلفية المظلمة.
بالنسبة لكل عضو في الفريق، كانت العملية كما يلي:
الخطوة 1 — صورة مرجعية. أرسل كل شخص صورة مرجعية واضحة — من الأفضل أن تكون مضاءة جيدًا وواجهة أمامية وكبيرة بما يكفي حتى تتمكن العارضة من قراءة تفاصيل الوجه بدقة. عملت صور السيلفي بالهواتف الذكية في الضوء الطبيعي الجيد بشكل جيد. عملت لقطات الرأس الاحترافية بشكل أفضل.
الخطوة 2 — التحميل والتوليد. لقد قمنا بتحميل الصورة المرجعية إلى ChatGPT جنبًا إلى جنب مع المطالبة الكاملة. يقبل إنشاء الصور في GPT-4o الصور المرجعية ويستخدمها كمثبتات للهوية عندما يطلب منه الموجه ذلك صراحةً.
الخطوة 3 — المراجعة والتكرار. كان الجيل الأول عادةً متقاربًا ولكنه لم يكن مثاليًا. كانت المشكلات الشائعة هي الانحراف الطفيف عن الشبه المرجعي - حيث يحافظ النموذج على العرق العام والشعر ولكنه يخفف أو يغير ملامح الوجه المحددة. سنقوم بالتحسين باستخدام تعليمات متابعة مثل "الأنف مختلف عن المرجع - احتفظ بشكل الأنف الدقيق من الصورة المرجعية" أو "العيون في المرجع أضيق قليلاً - قم بمطابقة ذلك بشكل أكثر دقة."
الخطوة 4 — التحديد ووضع اللمسات النهائية. بعد مرتين أو ثلاث مرات، وصلت كل صورة إلى مستوى الجودة الذي نحتاجه. لقد قمنا بالتصدير بأقصى دقة وأجرينا فحصًا نهائيًا لمقارنة كل صورة مع الصورة المرجعية للتأكد من دقة التشابه قبل النشر.
استغرقت العملية برمتها لعضو واحد في الفريق - بدءًا من الصورة المرجعية وحتى الصورة النهائية - ما يقرب من 20 إلى 30 دقيقة. كان التصوير التقليدي في الاستوديو لنفس النتيجة سيستغرق نصف يوم من التنسيق والحجز والسفر ووقت التحرير بعد ذلك.
يستحق هذا الأمر معالجة مباشرة لأنه لا يزال هناك تردد في بعض الدوائر حول استخدام الصور المولدة بواسطة الذكاء الاصطناعي في السياقات المهنية. عادة ما تكون الحجة حول الأصالة، أي أن صور الذكاء الاصطناعي أقل أصالة إلى حد ما من الصور الفوتوغرافية.
أصبحت هذه الحجة أكثر منطقية عندما أنتج توليد صور الذكاء الاصطناعي مصنوعات فنية واضحة - أعداد خاطئة من الأصابع، وآذان ذائبة، وعيون تشير إلى اتجاهات مختلفة، وأنسجة الجلد التي تبدو وكأنها تم تقديمها تحت الماء. وفي عامي 2025 و2026، لم يعد هذا هو خط الأساس. يُنتج توليد الصور بواسطة GPT-4o صورًا ذات ملمس جلدي مقنع، وتفاصيل دقيقة لنسيج الملابس، بالإضافة إلى الحفاظ على التشابه الحقيقي - مع موجه مصمم جيدًا وصورة مرجعية جيدة.
السؤال الأكثر فائدة ليس ما إذا كانت صور الذكاء الاصطناعي أصلية، بل ما إذا كانت تخدم الغرض. بالنسبة لصفحة الفريق على موقع الويب، فإن الغرض من الصورة هو إعطاء الزائرين فكرة عن الأشخاص الذين يقفون وراء المنتج - وجودهم، واحترافهم، وشخصيتهم. تقوم صورة الذكاء الاصطناعي جيدة الإنشاء بذلك. إن الصورة المتواضعة التي يتم التقاطها في إضاءة سيئة في مكتب منزل شخص ما تكون أقل جودة.
هناك أسباب عملية محددة تجعل صور الذكاء الاصطناعي منطقية بالنسبة لنا وستكون منطقية للعديد من الشركات في الإمارات العربية المتحدة في عام 2026:
فرق موزعة. عندما يعمل فريقك عبر مواقع مختلفة - وهو أمر شائع بشكل متزايد بعد عام 2020 - يكون تنسيق جلسة تصوير في موقع واحد أمرًا صعبًا حقًا. يقوم الذكاء الاصطناعي بإزالة قيود الموقع بالكامل.
الاتساق البصري. من الصعب الحفاظ على اتساق لقطات الفريق التقليدية عندما يتغير أعضاء الفريق. سيحصل الموظف الجديد الذي ينضم بعد ستة أشهر من جلسة التصوير الأصلية على صورة شخصية من جلسة مختلفة، وإضاءة مختلفة، وإطار مختلف. باستخدام نظام الصور الشخصية بالذكاء الاصطناعي والمطالبة المحفوظة، يحصل كل عضو جديد في الفريق على صورة تبدو وكأنها تم التقاطها في نفس اليوم مثل أي شخص آخر.
التحكم في العلامة التجارية. أردنا صورًا شخصية تظهر اسم علامتنا التجارية على وجه التحديد في الخلفية. لن يقوم أي مصور بتركيب ذلك في 10 صور بسعر معقول. مع الذكاء الاصطناعي، تم دمجها في الموجه - كل صورة لها نفس المقياس، في نفس الموضع، مع نفس المعالجة المطبعية.
السرعة. أطلقنا الموقع في الموعد المحدد. لم يكن انتظار جدولة جلسة التصوير وتنفيذها وتحريرها متوافقًا مع هذا الموعد النهائي. تم التقاط صور الذكاء الاصطناعي في الوقت الذي استغرقه كل عضو في الفريق لإرسال صورة شخصية لنا والانتظار لمدة 30 دقيقة.
إن إنشاء صور الذكاء الاصطناعي في عام 2026 ليس مستقلاً بالكامل. إن سقف الجودة مرتفع ولكن الوصول إليه يتطلب تحفيزًا ماهرًا وتكرارًا دقيقًا وحكمًا بشريًا في كل مرحلة.
مرساة الهوية هي الجزء الأصعب في الحصول على حق باستمرار. العارضات أفضل في الحفاظ على المظهر العام من السمات المحددة الدقيقة - الشكل الدقيق لأنف شخص ما، والطريقة المحددة التي تجلس بها عيونه، والبنية الدقيقة لخط الفك. يتطلب الحصول على هذا الأمر بشكل صحيح مقارنة بين المرجع والمخرجات، وتعليمات تصحيحية محددة، وفي بعض الأحيان مرور عدة أجيال. لا يمكنك فقط تحميل صورة والابتعاد.
يتطلب تناسق الإضاءة عبر مجموعة صور شخصية الحفاظ على نفس الموجه والتكرار عندما ينحرف جيل معين عن المظهر المحدد. تنتج الاختلافات السريعة الصغيرة اختلافات ملحوظة في الإضاءة تؤدي إلى كسر التماسك البصري لصفحة الفريق.
وضمان الجودة مهم. ليست كل الأجيال قابلة للاستخدام، فبعضها يحتوي على قطع أثرية دقيقة لا يمكن رؤيتها إلا بالدقة الكاملة. إن المراجعة الدقيقة لكل مخرجات قبل النشر ليست أمرًا اختياريًا.
ما يزيله الذكاء الاصطناعي هو النفقات اللوجستية والمالية. ما لا يزيله هو الاتجاه الإبداعي، والحكم، والعين على الجودة. هذه هي الآن المساهمة البشرية في العملية التي كانت تتطلب فريق إنتاج كامل.
لقد استخدمنا ثلاث أدوات في مراحل مختلفة من هذا المشروع ولكل منها نقاط قوة مختلفة تستحق الفهم.
كان Grok (xAI) مفيدًا للغاية في الهندسة الفورية، حيث تم تحسين اللغة وتشديد القيود وهيكلة الموجه بطريقة تعطي نماذج إنشاء الصور تعليمات واضحة لا لبس فيها. إن نقاط القوة التحليلية التي يتمتع بها Grok تجعله أداة جيدة للمهمة الوصفية المتمثلة في إنشاء مطالبات أفضل.
حقق Google Gemini نتائج قوية، لا سيما فيما يتعلق بدقة لون البشرة للصور المرجعية من جنوب آسيا والشرق الأوسط، وهو أمر مهم لفريق مقيم في دبي. يميل تدرج الألوان في مخرجات Gemini إلى أن يكون أكثر دفئًا قليلاً من ChatGPT، والذي يمكن أن يعمل بشكل أفضل أو أسوأ اعتمادًا على الجمالية التي تسعى إليها.
ChatGPT (GPT-4o) كان خيارنا النهائي للصور المنشورة. كان فصل إضاءة الحافة أكثر وضوحًا، وكان نسيج نسيج المعطف أكثر إقناعًا، وكانت الجودة السينمائية الشاملة أكثر توافقًا مع الجمالية المتميزة التي كنا نسعى إليها. كان اتساق مرساة الهوية - مدى الحفاظ على ميزات الوجه المحددة عبر التكرارات - أقوى أيضًا في اختباراتنا.
لا تعد أي من هذه الأدوات أفضل بشكل قاطع في جميع حالات الاستخدام. بالنسبة لهذه المطالبة المحددة وهذه الجمالية المحددة، أنتج ChatGPT المخرجات التي تطابق رؤيتنا بشكل وثيق. قد يكون هذا التقييم مختلفًا بالنسبة لمطالبة مختلفة، أو نمطًا مختلفًا، أو مجموعة سكانية مختلفة للصور المرجعية.
تعد صور الفريق جزءًا من تحول أوسع تتيحه أدوات الذكاء الاصطناعي للشركات لبناء أو إعادة بناء تواجدها على الويب في عام 2026. حيث يتجه التصوير الفوتوغرافي والتوضيح والأيقونات وصور العلامة التجارية نحو نموذج يتعامل فيه الذكاء الاصطناعي مع حجم الإنتاج ويتعامل التوجيه الإبداعي البشري مع الموجز وشريط الجودة والاختيار النهائي.
هذا ليس بديلاً للتصوير الفوتوغرافي في جميع السياقات. لا يزال تصوير المنتجات وتوثيق الأحداث والصحافة التحريرية يتطلب الكاميرات والمصورين. لكن التصوير الفوتوغرافي الاحترافي لصفحة الفريق - وهو تصوير متحكم به على طراز الاستوديو مع جمالية متسقة - هو بالضبط نوع العمل الذي وصل فيه جيل الذكاء الاصطناعي إلى مستوى الجودة الذي يجعله بديلاً جديًا.
والنتيجة على موقعنا الإلكتروني هي صفحة فريق تبدو أكثر اتساقًا من الناحية البصرية، وأكثر إضاءة بشكل كبير، وتتميز بعلامة تجارية أكثر وضوحًا من معظم صفحات الفريق التي تم تصويرها بشكل احترافي والتي رأيناها. لقد كلفنا ذلك بضع ساعات من العمل الفوري بدلاً من بضعة آلاف من الدراهم وتصوير لمدة نصف يوم.
وقد أصبح من الصعب على نحو متزايد الجدال ضد هذه المقايضة.


At Joyboy, we build and design digital products for UAE businesses — from websites to full brand identity systems. See what we can build for you.