يشهد عالم الذكاء الاصطناعي تحولاً تقنياً متسارعاً، مع بروز الصوت كواجهة مرشحة لتصبح الأساس في التفاعل بين الإنسان والأنظمة الذكية، بدلاً من النصوص والشاشات التقليدية.
وقال الرئيس التنفيذي لشركة ElevenLabs المتخصصة في تقنيات الصوت، بحسب موقع TechCrunch، إن تقنيات الصوت لم تعد تقتصر على تقليد الكلام، بل تطورت لتعمل مع نماذج قادرة على فهم السياق والتفاعل بذكاء؛ ما يجعل التواصل أكثر طبيعية وسلاسة.
وأكد أن المستقبل القريب سيشهد اعتماداً متزايداً على التفاعل الصوتي، خصوصاً مع انتشار الذكاء الاصطناعي في الأجهزة القابلة للارتداء، والسيارات، والهاردوير الذكي، مشيراً إلى أن المستخدمين سيتحدثون مع التقنية أكثر مما يكتبون أو يلمسون الشاشات، مبيناً أنه يؤمن أن الصوت هو الواجهة الطبيعية القادمة للذكاء الاصطناعي، لأنه يقرب التقنية من الإنسان ويجعل التفاعل أسرع وأسهل وأكثر إنسانية، عندما يفهم النظام السياق ويتذكر المحادثة، يصبح الصوت جزءاً من الحياة اليومية.
ولاقت هذه الرؤية دعماً قوياً من المستثمرين، بعدما جمعت ElevenLabs تمويلاً بقيمة 500 مليون دولار، لترتفع قيمتها السوقية إلى نحو 11 مليار دولار، في مؤشر واضح على الثقة المتزايدة في سوق تقنيات الصوت، ولا يقتصر هذا التوجه على ElevenLabs؛ إذ تستثمر شركات كبرى مثل OpenAI وGoogle وApple بشكل متسارع في تقنيات الصوت، وسط توقعات بأن تعتمد واجهات التفاعل القادمة على الذاكرة والسياق المستمر لجعل المحادثات أكثر طبيعية وأقل اعتماداً على الأوامر المباشرة.
من جهته، قال الشريك العام في Iconiq Capital سيث بييريبونت، إن الشاشات ستظل مهمة للألعاب والترفيه، لكن أدوات الإدخال التقليدية مثل لوحات المفاتيح بدأت تبدو قديمة، مع تحول أنظمة الذكاء الاصطناعي إلى وكلاء أذكى وأكثر استقلالية، مشيراً إلى أن أنظمة الصوت المستقبلية ستعتمد على تراكم الذاكرة والسياق مع مرور الوقت؛ ما يقلل الجهد المطلوب من المستخدم ويجعل التفاعل أكثر سلاسة.
وفي هذا الإطار، تعمل ElevenLabs على تطوير نموذج هجين يجمع بين المعالجة السحابية والمعالجة على الجهاز؛ لدعم الجيل القادم من الأجهزة، بما في ذلك سماعات الرأس والأجهزة القابلة للارتداء، حيث يصبح الصوت رفيقاً دائماً للمستخدم.
وتتعاون الشركة بالفعل مع ميتا لدمج تقنيتها الصوتية في منتجات مثل إنستغرام وHorizon Worlds، كما أبدت انفتاحها على العمل مع نظارات Ray-Ban الذكية.
وفي المقابل، يثير هذا التوسع مخاوف متزايدة بشأن الخصوصية والمراقبة، وكمية البيانات الشخصية التي قد تخزنها أنظمة الصوت مع اندماجها العميق في حياة المستخدمين اليومية، وهي مخاوف سبق أن واجهت شركات تقنية كبرى بسبب ممارسات مشابهة.