بازشناسی گفتار

فرهنگستان زبان و ادب

{speech recognition} [رایانه و فنّاوری اطلاعات] فرایند تشخیص واژه های منفرد که در برابر آوابَر ادا می شوند متـ . بازشناسی صدا voice recognition

دانشنامه عمومی

هدف از تشخیص گفتار که در متون علمی بیشتر با نام بازشناسی گفتار شناخته شده است، طراحی و پیاده سازی سیستمی است که اطلاعات گفتاری را دریافت و متن و فرمان گوینده را استخراج می کند. فناوری بازشناسی گفتار به رایانه ای که توانایی دریافت صدا را دارد ( برای مثال به یک میکروفن مجهز است ) این قابلیت را می دهد که گفتار کاربر را متوجه شود.
فناوری تبدیل گفتار به متن ممکن است به عنوان جایگزینی برای صفحه کلید یا ماوس برای وارد کردن دستورها مورد استفاده قرار گیرد. سیستم های واکافت کننده گفتار انواع مختلفی دارند، بعضی قادرند گفتار پیوسته را شناسایی نمایند، بعضی دیگر فقط می توانند گفتار گسسته ( که بین کلمات سکوت وجود دارد ) را شناسایی کنند. همچنین سیستم ها قادرند واژگان گفته شده توسط افراد مختلف یا فقط توسط یک گوینده را تشخیص دهند. به هر حال ایده آل ترین سیستم آن است که بتواند گفتار پیوسته غیر وابسته به گوینده را در محیط نویزی شناسایی نماید.
این سیستم ها با به کارگیری روش های مختلف طبقه بندی و شناسایی الگو قادرند به تشخیص واژگان هستند که البته برای افزایش دقت در شناسایی از یک فرهنگ لغات نیز در انتهای سیستم استفاده می شود. روشهایی مانند Hidden Markov Model یا Neural Network در بسیاری از سیستم های تشخیص گفتار مورد استفاده قرار می گیرند و در بخش های انتهایی سیستم از هوش مصنوعی کمک گرفته می شود.
یک سیستم بازشناسی گفتار خودکار ( Automatic Speech Recognition ) که به اختصار ASR نامیده می شود با چالشهای فراوانی روبروست. از جمله مهمترین این چالش ها می توان به وجود نویز، انتخاب مجموعه ویژگی های مناسب، انتخاب مدل آکوستیکی مناسب، تنوع زبان، تنوع جنسیت و مشکل لهجه در بازشناسی گفتار اشاره نمود. در مورد زبان های رایج مانند انگلیسی کارهای زیادی در جهت مقابله با این چالش ها انجام شده است اما در مورد زبان فارسی هنوز راه زیادی در پیش است.
امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکارگیری نرم افزار تشخیص گفتار می توان دستورها یا کلمات را به صورت صوتی به کامپیوتر وارد کرد. حتی در بعضی از گوشی های تلفن همراه از این سیستم ها جهت دریافت دستورها به صورت صوتی استفاده می شود.
از آنجا که ارتباط کلامی راحت ترین، ساده ترین و سریع ترین راه ارتباطی می باشد با کمک سیستم های تشخیص گفتار می توان با رایانه ها از طریق صحبت ارتباط برقرار نمود، با آن ها حرف زد، دستور داد یا از پشت تلفن و از راه دور بتوان سیستم های خانگی را کنترل نمود. با کمک این محصولات، بسیاری از افراد معلول یا افرادی با آشنایی محدود با کامپیوتر و زبان های خارجی نیز می توانند تنها از طریق صحبت کردن با کامپیوتر ارتباط برقرار نمایند.
عکس بازشناسی گفتار
این نوشته برگرفته از سایت ویکی پدیا می باشد، اگر نادرست یا توهین آمیز است، لطفا گزارش دهید: گزارش تخلف

پیشنهاد کاربران

بپرس