فناوری تشخیص صدا


اینکه دستگاهی باشد که حرف ما را بفهمد، با ما صحبت کند و حتی کارهایمان را انجام دهد روزگاری تنها یک خیال بود. اما امروزه با وجود گجت های جدید به امری بسیار ساده تبدیل شده .

این قابلیت از اکتبر 2011 به وسیله اپل و گوشی های آیفون 4-اس معرفی شد که به فاصله بسیار نزدیکی توسط سامسونگ (s-voice) و گوگل (google voice) نیز عملی شد.


در اینجا به صورت مختصر به قابلیت های این فناوری اشاره می کنیم:

Siri
 

در این اپلیکیشن، با فشار دادن کلید Home  که در زیر صفحه نمایش آی فون قرار دارد می توان سیری را فعال کرد و آماده دریافت دستورات صوتی کاربر می‌‌‌‌‌‌‌‌‌شود.
در این مرحله سیری ضمن تشخیص نوع دستورات وارد شده از سوی کاربر در مورد اجرای محلی (Local) دستورات یا ارسال آنها از طریق شبکه به سرورهای ابری  (Cloud) تصمیم‌گیری می‌کند. دستورات داخلی با توجه به الگوی در اختیار نرم‌‌‌‌‌‌‌‌‌افزار به سرعت از طریق خود گوشی اجرا شده و دستورات ارسال‌شده برای سرور نیز توسط نرم‌‌‌‌‌‌‌‌‌افزارهای تحلیل داده مورد تحلیل و بررسی قرار می‌‌‌‌‌‌‌‌‌گیرد.

S-Voice

این قابلیت به هنگام معرفی سری سوم کهکشانی های سامسونگ رونمایی شد. زبان‌‌‌‌‌‌‌‌‌هایی که توسط  S Voice پشتیبانی می شوند شامل: انگلیسی، فرانسه، اسپانیایی، ایتالیایی، آلمانی و کره‌‌‌‌‌‌‌‌‌ای می‌شود که در مقایسه با سیری لیست کامل‌‌‌‌‌‌‌‌‌تری از زبان ها را تشکیل می‌دهد.
بعضی از نرم افزارها و اپلیکیشن‌‌‌‌‌‌‌‌‌هایی که توسط  S Voice پشتیبانی می شوند برای اجراشدن به دستورات صوتی به خصوصی احتیاج دارند. برای مثال، جهت فعال کردن دوربین می ‌‌‌‌‌‌‌‌توان از «I want to take a picture» و برای گرفتن عکس از عبارت «!Cheese» استفاده کرد.
 S Voice از پایگاه داده Wolfram Alpha برای جست‌وجوی سوالات علمی و پایه‌‌‌‌‌‌‌‌‌ای کاربران استفاده می‌کند که دقیقا همان منبع مورد استفاده سیری است و از این لحاظ نمی‌توان تفاوتی میان این دو قائل شد.

Google Voice
نسخه جدید Google Voice در ورژن ۴٫۱ اندروید، تغییرات بی‌‌‌‌‌‌‌‌شماری را نسبت به گذشته تجربه کرده و این ‌‌‌‌‌‌‌‌ بار تقریبا می‌‌‌‌‌‌‌‌‌توان در رابطه با هر چیزی از گوگل سوال پرسید. در تست‌‌‌‌‌‌‌‌های صورت‌پذیرفته روی Google Voice سرعت و دقت بسیار بالایی به چشم می‌‌‌‌‌‌‌‌‌خورد که در مقایسه با سیری نیز نتایج بسیار مطلوب‌تری را نشان می ‌‌‌‌‌‌‌‌دهد.

یکی از قابلیت‌‌‌‌‌‌‌‌‌های جدید Google Voice امکان تبدیل صدا به متن به صورت آفلاین است، به طوری که سرعت بالاتری در حین نوشتن متن بدون نیاز به اینترنت فراهم می‌شود. این اینترفیس با آموختن نوع الگوریتم مورد استفاده کاربر به مرور زمان کیفیت بالاتری از اجرا را ارائه می‌دهد.


Windows Phone Speech
سرویس Voice اختصاصی شرکت مایکروسافت موسوم به Speech که از نسخه ۷٫۵ سیستم‌عامل Windows Phone پا به عرصه وجود گذاشت.

بزرگ‌ترین نکته قابل اشاره در مورد Speech و کلیدی‌ترین قابلیت این برنامه امکان استفاده از آن در دیگر برنامه‌‌‌‌‌‌‌‌‌ها و عدم محدودیت آن به برنامه‌های اصلی و پیش‌فرض سیستم‌‌‌‌‌‌‌‌‌عامل است که مایکروسافت از آن با عنوان امکان گفت‌وگوی مستقیم با اپلیکیشن‌ها یاد می‌کند.
از این طریق برنامه‌‌‌‌‌‌‌‌‌نویسان و توسعه‌دهندگان سیستم ‌‌‌‌‌‌‌‌عامل ویندوزفون امکان تعریف کنترلرهای صوتی مختلف برای برنامه خود را پیدا می‌کنند و از این طریق امکان در اختیار داشتن برنامه از طریق دستورهای صوتی را برای کاربران فراهم می‌آورند.