نصائح مفيدة

التحكم الصوتي بالهاتف الذكي

هناك العديد من الحلول المختلفة للتحكم الصوتي في وظائف الهواتف الذكية ، ولكن لا يتم تنفيذ جميعها بجودة كافية. لقد اخترنا تلك التي تعمل حقًا.

يعد التحكم الصوتي عند العمل مع الهواتف الذكية وأجهزة الاتصال الحديثة المزودة بوحدات معالجة مركزية قوية بما فيه الكفاية اتجاهًا راسخًا في إنشاء واجهات مستخدم مريحة. من الممكن بدرجات متفاوتة على جميع منصات المحمول الرئيسية. في نظام التشغيل iOS ، ظهر في الإصدار 3.0 (يعمل بكامل طاقته بدءًا من 4.0) ، في Google Android - في الإصدار 1.6 (يعمل بكامل طاقته - من 2.2). يتم تنفيذ هذه الميزة بشكل جيد نسبيًا في Windows Mobile و S60. لقد اخترنا العديد من الحلول التي يمكن أن تحل محل وحدات التحكم الصوتي القياسية ، بالإضافة إلى برامج لتوسيع الوظائف.

الخصائص الرئيسية لأنظمة التعرف على الكلام

على مدار العامين أو الثلاثة أعوام الماضية ، تم اعتبار التحكم في الكلام أحد أكثر التقنيات الواعدة المستخدمة في إنشاء واجهات المستخدم. صرح بذلك قادة Microsoft ، وأبدى ممثلو Google و Apple اهتمامًا ملحوظًا.

في الواقع ، يبدو التحكم في جهاز اتصال محمول عن طريق الضغط على الأزرار أمرًا قديمًا بالفعل. يتم تسويق شاشات اللمس والصوت كطرق طبيعية لتفاعل البشر والأجهزة الذكية. من الخصائص المهمة لهذه الأنظمة التعرف الصحيح على الأوامر. إذا كان كل شيء أكثر أو أقل وضوحًا مع التحكم باللمس (تدعم الهواتف الذكية الحديثة التحكم باستخدام إيماءات اللمس المتعدد المعقدة) ، فلن تكون الأمور بهذه البساطة مع الأوامر الصوتية.

أولاً ، قد لا يستجيب النظام دائمًا بشكل صحيح لكيفية نطق الأوامر. سيتعين عليك التكيف مع مثل هذا التحكم ، وهو أمر غير مناسب دائمًا: من المتعب للغاية تتبع جرس الصوت والنغمات طوال الوقت. في هذه الحالة ، يجب فصل الأوامر عن ضوضاء الخلفية العامة ، الأمر الذي يتطلب موارد حسابية.

ثانيًا ، لا يتم تشغيل مثل هذا النظام تلقائيًا - لتنشيطه ، كقاعدة عامة ، تحتاج إلى الضغط على زر على جهاز أو ملحق (على سبيل المثال ، سماعة رأس لاسلكية). لا يعد تضمين البرامج مناسبًا دائمًا. على الاتصالات مع Windows Mobile مع حزمة برامج Broadcomm ، قد يعمل تنشيط Microsoft Voice Commander من سماعة رأس Bluetooth غير مستقر أو لا يعمل على الإطلاق.

ثالثًا ، التحكم الصوتي غير قادر حتى الآن على تصحيح أخطاء المستخدم غير الدقيقة. على سبيل المثال ، إذا حاولت بدء تشغيل أغنية لمجموعة يحتوي عنوانها على المقالة "the" دون ذكرها ، فلن يفهم الجهاز في معظم الحالات مثل هذا الأمر. تظهر الصعوبات أيضًا عند طلب الأسماء والأسماء من دفتر ملاحظات - للتشغيل الصحيح ، تحتاج إلى ملء حقل "الاسم المستعار" وتعيين أمر تشغيل إضافي.

رابعًا ، من أجل الاستخدام المستمر للاتصال الصوتي (على سبيل المثال ، عند كتابة رسالة نصية قصيرة) ، يقوم معالج الجهاز المحمول بتشغيل وحدات كثيفة الاستخدام للموارد من نظام التعرف. هذا ليس له أفضل تأثير على أداء وعمر بطارية جهاز الاتصال. ومع ذلك ، يتم الآن حل هذه المشكلة تدريجياً.

Vlingo هي وحدة تحكم صوتي عبر الأنظمة الأساسية للعمل مع برامج الطرف الثالث

يوفر Speereo Voice Launcher مجموعة غنية من الوظائف للتحكم الصوتي وحتى لا يفهم النطق الواضح للغاية

إدارة وظائف النظام القياسية والبحث الصوتي.

في جميع أنظمة تشغيل الهواتف المحمولة الشائعة ، يتم تنفيذ إمكانية التعرف على الصوت للأوامر لتشغيل تطبيقات نموذجية. على سبيل المثال ، طلب رقم من دفتر ملاحظات أو فتح عميل بريد إلكتروني أو بدء قائمة تشغيل.بالإضافة إلى ذلك ، يمكن لهذه الوحدات أن تصدر صوتًا لعمليات النظام ، وتبلغ أن الهاتف يعمل على مستوى منخفض أو تحول إلى وضع التنبيه الصامت. لا يستطيع أي من البرامج تنفيذ أوامر أكثر تعقيدًا (على سبيل المثال ، "افتح عميل بريد إلكتروني ، واكتب رسالة إلى السيد إيفانوف ، وحدد جميع الرسائل في صندوق الوارد كمقروءة بعد إرسالها"). ومع ذلك ، فهي تتطور تدريجيا. لذلك ، إذا سألت جهاز iPhone استنادًا إلى iOS4 عن الوقت الآن ، فسيتم الإعلان عن وقت النظام. بالإضافة إلى ذلك ، يتفهم نفس البرنامج الصوتي لنظام التشغيل هذا الاستجابات السلبية للمستخدم: "لا" ، "خطأ" ، "خطأ" ، إلخ. في أنظمة الهاتف المحمول الأخرى ، بدلاً من ذلك ، عليك اللجوء إلى التحكم باللمس.

في أجهزة WM الكلاسيكية ، يتم استخدام حزمتين للتحكم الصوتي - Cyberon Voice Commander و Microsoft Voice Command. ومع ذلك ، لن تتمكن من استخدامها في نفس الوقت - عليك اختيار واحدة.

الأول يتطلب بعض التدريب للتعرف على الأوامر ، على الرغم من أن القائمة ليست كبيرة جدًا. يمكن للبرنامج الاتصال بجهات الاتصال وإدخالات التقويم وتشغيل جميع التطبيقات القياسية وبعض تطبيقات الطرف الثالث وتشغيل الموسيقى وكذلك قراءة الرسائل الواردة. تتحكم الحزمة الثانية بالإضافة إلى ذلك في مستوى الصوت ، وطريقة تشغيل الاتصالات اللاسلكية ، وكذلك أصوات أحداث النظام. كان لدى Microsoft مؤخرًا منتج مثير للاهتمام ، TellMe ، للتحكم الصوتي المتقدم. إنه قادر على إطلاق عميل بحث Bing بطلب إملائي للمعلومات ، والتحدث عن أسعار الأسهم ، والنتائج الرياضية ، والطقس ، والأفلام ، وظروف حركة المرور. لكن لكل هذا ، يجب أن يكون الجهاز متصلاً بالإنترنت وأن يكون في مجال رؤية أقمار GPS الصناعية. هذه هي الأدوات المستخدمة لحساب الموقع. بالإضافة إلى ذلك ، هذه الخدمة غير متوفرة باللغة الروسية.

في الإصدار 2.2 من نظام التشغيل iOS و Android أعلاه من FroYo ، تكون أنظمة الاتصال الصوتي المدمجة متماثلة تقريبًا ، باستثناء أن منتج Google لديه القدرة على توجيه المسارات باستخدام الخرائط إلى موقع مكتب شركة معينة أو نقطة معينة . في الإصدار الخامس من نظام التشغيل Symbian OS ، يكون التحكم الصوتي مسؤولاً فقط عن تنفيذ الوظائف القياسية للنظام ، وبالنسبة للبحث الصوتي ، ستحتاج إلى تثبيت برنامج منفصل - على سبيل المثال ، Google Mobile App.

التحكم الصوتي في الوظائف الإضافية وتشغيل برامج الجهات الخارجية

بالطبع ، يجب ألا تسهل الأدوات الصوتية العمل اليومي مع المتصل جزئيًا فحسب ، بل يجب أن تتولى بشكل كامل أداء الأنشطة اليومية. علاوة على ذلك ، ليس فقط مع البرامج القياسية ، ولكن أيضًا مثبتة من قبل المستخدم. لهذه الأغراض ، يمكنك استخدام منتجات منفصلة - على سبيل المثال ، Speereo Voice Launcher. هذا البرنامج متوافق مع نظام التشغيل Symbian OS (بما في ذلك S60) و Windows Mobile وفي المستقبل مع نظام التشغيل Android OS. إنه غلاف مضغوط يسمح لك بجدولة إطلاق أي تطبيقات وملفات والانتقال إلى أي صفحة ويب في المتصفح.

لا يعتمد المنتج كثيرًا على خصائص صوت مالك الجهاز: محرك التعرف قادر على اكتشاف الأوامر التي يتم نطقها بلهجة أو عيوب بسيطة في النطق. يتم توفير التكامل مع البرامج القياسية (دفتر ملاحظات ، منظم ، عميل الرسائل السريعة) ، ولكن لا يوجد نقل للإشارات المرجعية من المفضلة. يتم تنفيذ تعريف الأوامر للتشغيل من خلال إعدادات التطبيق. يكتب المستخدم اسم الأمر باللغة الروسية باللاتينية أو بإحدى اللغات المدعومة (الإنجليزية ، والألمانية ، والفرنسية ، وما إلى ذلك) ، وبعد ذلك يتم إدخاله في قاعدة البيانات. ومن المثير للاهتمام أن Speereo يلتقط الأوامر حتى في البيئات الصاخبة.

بالنسبة لإصدارات Google Android الأقل من 2.2 ، هناك ثلاثة تطبيقات تحل محل خدمة مشغل تطبيقات الإجراءات الصوتية التي ظهرت في Android OS FroYo. أولاً ، هذه برامج Edwin و Vlingo ، والتي تعمل باللغة الإنجليزية فقط.

الأول هو عميل متقدم للتعرف على الأوامر الصوتية لا يوفر عمليات البحث على Google فحسب ، بل يوفر أيضًا البحث عن الصيغ الرياضية في Wtolfram Alpha ، وإرسال الرسائل إلى Twitter ، وما إلى ذلك.

العميل الثاني (يعمل على أنظمة iOS و WM و S60 و RIM BlackBerry) لديه نفس ميزات Microsoft TellMe. بالإضافة إلى القدرة على إرسال الحالات إلى الشبكات الاجتماعية ، والبحث عن المسارات ومعلومات الاتصال الخاصة بالشركات في المنطقة. أخيرًا ، هناك TopVoiceControl لمتصلي Android. بالإضافة إلى الاتصال المعتاد بالأرقام من دفتر العناوين والتعرف على الأرقام المنطوقة ، يمكنه التحكم في الواجهات اللاسلكية وفتح التقويم.

عمل قائمة

لا يزال منظمو الصوت غريبين ، لكن التطبيقات الأولى من هذا النوع تظهر بالفعل وتكتسب بعض الشعبية. لذا ، فإن المطور المذكور أعلاه Speereo Software يقدم برنامج Speereo Voice Organizer ، المصمم لإنشاء إدخالات في رسائل البريد الإلكتروني "التقويم" و "المهام". ومع ذلك ، في هذه الحالة ، لا يتم تحويل الصوت إلى نص. يتم إرسال الرسالة كملف صوتي مرفق وتنبيهات حول المهام الحالية. يشتمل IOS على عميل بريد البريد الإلكتروني QuickVoice2Text ، والذي يتعرف على الرسائل التي تم إملاءها ويترجمها إلى تنسيق نصي.

بالنسبة إلى Google Android ، تم إصدار تطبيق صوتي Taskos To Do List لإضافة مهام إلى قائمة المهام وبرنامج لإرسال الرسائل القصيرة والرسائل والرسائل إلى Twitter يسمى VoiceLink.

قائمة المهام Taskos قم بإنشاء قائمة مهام من خلال إملاءها على جهاز Android OS الخاص بك

مرجع تاريخي

ظهرت تقنيات التعرف على الكلام الأولى في عام 1952 وأتاحت اكتشاف الأرقام المنطوقة تلقائيًا. بحلول أوائل التسعينيات ، ظهرت حلول في السوق يمكنها التعامل مع الكلمات والعبارات الفردية ، بالإضافة إلى الجمل البسيطة. كانت شائعة في الولايات المتحدة وتستخدم من قبل الطب والجيش. بدأ تعميم أنظمة التحكم الصوتي بين المستهلكين العاديين فقط في مطلع القرنين العشرين والحادي والعشرين - مع ظهور الهواتف الذكية.