صنعت کامپیوتر که راهبری سیستمهای اطلاعاتی، مالی و امنیتی نوین را بر عهده دارد برای اعمال کنترل صحیح بر نحوهی دسترسی به سیستمهای یاد شده توسط کاربران، سالهاست که از سیستم سادهی نام کاربر و کلمهی عبور استفاده مینماید. با وجود آن که سیستم مزبور از نظر پیادهسازی بسیار ساده و کمهزینه میباشد، به این دلیل که تضمین نمیکند شخص دارندهی یک شناسهی مجاز همان شخصی است که شناسهی مزبور برای استفادهی اختصاصی او در نظر گرفته شده، امنیت مورد انتظار برای سیستمهای مهم را تأمین نمینماید. آمار رو بهفزون تقلبهای کامپیوتری به صورت گذر غیر مجاز از سیستم یاد شده نشانگر این عدم تواناییست که انگیزهی جستجوی جایگزینی مطمئن برای آن را در ذهن متخصصان امر پرورده است.
از سوی دیگر تکنیک استفاده از ویژگیهای منحصر به فرد زیستی انسانها برای بازشناسی آنان دیرزمانیست که در حیطهی جرمشناسی به لحاظ باور علمی این مطلب که این ویژگیها غیر قابل تقلید بوده، احتمال مشابهت آنها در افراد صفر یا عددی مشابه آن است به عنوان ابزاری مطمئن و کارآمد مطرح میباشد و متخصصان طراحی سیستمهای امنیتی الکترونیکی نیز در دهههای اخیر به این فنآوری به عنوان مهمترین اساس برای طراحی سیستمهای امنیتی وابسته به فرد خاص نظر داشتهاند.
اهمیت موضوع یاد شده از یک سو و تازگی آن از سوی دیگر تهیهکنندهی این نوشتار را بر آن داشت تا با راهنمایی استاد محترم جناب آقای دکتر نقشنیلچی موضوع پروژهی پایانی خود را مطالعه بر روی این گونه سیستمها و طراحی یک سیستم امنیتی نمونه بر اساس ویژگیهای منحصر به فرد صوتی افراد انتخاب نماید که دستاورد آن یک سیستم تشخیص گویندهی وابسته به متن به عنوان نتیجهی عملی و این نوشتار به عنوان فراهم آورندهی پیشزمینههای علمی و توصیفکنندهی نحوهی عملکرد آن میباشد.
پیش از هر چیز تأکید بر این مطلب ضروری به نظر میرسد که این نوشتار نه به عنوان یک مرجع برای موضوع طراحی سیستمهای تشخیص گوینده بلکه به عنوان راهنمایی برای افراد علاقمند به ادامهی این کار فراهم آمده است و از این لحاظ سعی شده که به جای پوشش تمامی روشهای ممکن و ارائهی الگوریتمهایی که در پروژهی عملی کاربردی نداشتهاند از آنها به صورت اشارهوار یاد شود و در عوض زمینههای تئوری و روشهای برنامهنویسیِ عملاً استفاده شده، به صورت مشروحتر بیان شدهاند. ذکر فهرست منابع هر فصل در پایان آن، توضیح کد توابع استفاده شده و ارائهی پیشزمینههای نظری و روشهای برنامهنویسی برای پردازش صوت به صورت ابزارهایی برای تحقق این هدف به کار گرفته شدهاند که به نظر میرسد نمیتوانند جایی در بین مطالب یک مرجع برای مطلب یاد شده داشته باشند.
بدنهی اصلی نوشتار از سه بخش تشکیل شده است. بخش اول مقدمهای است بر اهمیت و کاربردهای سیستمهای زیستسنجی و به طور خاص سیستمهای تشخیص گوینده. این بخش شامل دو فصل است و مطالب آن عمدتاً مقدمات لازم برای بخش سوم نوشتار را فراهم میآورد. در بخش دوم پردازش صوت را به صورت نظری مورد بررسی قرار خواهیم داد و سپس مطالب نظری یاد شده را در قالب یک کتابخانه برای پردازش صوت از دیدگاه برنامهنویسی پیادهسازی خواهیم نمود. این بخش تا حد زیادی مستقل از دو بخش دیگر نوشتار میباشد ولی به لحاظ نوع مخاطب و هدف این نوشتار پرداختن به آن ضروری به نظر میرسد. بخش یاد شده نیز شامل دو فصل میباشد. بخش آخر که مرتبطترین بخش نوشتار با سیستم عملی است و دربردارندهی چهار فصل است پردازش صحبت را از دیدگاه تئوری و برنامهنویسی مورد بحث قرار میدهد. بحث با فصلی در مورد پردازش سیگنال صحبت که در واقع به نوعی میتواند ادامهی بخش قبل تلقی گردد آغاز میگردد و در ادامه مدلسازی سیگنال به عنوان شیوهای برای استخراج الگوهای قابل مقایسه از سیگنال صحبت مطرح میشود و در آخرین فصل نظری این نوشتار روشهای مختلف معمول برای طراحی سیستمهای تشخیص گوینده بررسی میشوند. نهایتاً در آخرین فصل این نوشتار یک کتابخانهی نمونهی تشخیص گوینده که در پیادهسازی قسمت عملی مورد استفاده قرار گرفته است ارائه میگردد.
در ضمیمهی اول این نوشتار شیوهی نصب و روش استفاده از سیستم پیادهسازی شده مطرح گردیده است و ضمیمهی دوم آن ارائهدهندهی فهرست کاملی از منابع متفرقهی اینترنتی یافت شده که بسیاری از آنها به دلایل مختلف در این پروژه مورد استفاده قرار نگرفتهاند برای خوانندگانی که قصد انجام کاری مشابه با این پروژه را دارند میباشند.
با توجه به آن که منابع عمدهی این نوشتار، عمدتاً انگلیسی زبان میباشند ارائهی معادلهای مناسبِ حتیالامکان فارسی برای اصطلاحات علمی که در منابع فارسی معادلی برای آنها یافت نشده سرلوحهی کار فراهمآورندهی این نوشتار قرار داشته و به منظور انتقال هر چه بهتر مطلب سعی شده با ارائهی پاورقیها یا توضیحات اضافی، مخاطب نوشتار با اصل اصطلاحات آشنا شود. علاوه بر آن در مواردی که ارائهی واژه به صورت انگلیسی مناسبتر تشخیص داده شده واژه با حروف فارسی در متن اصلی به کار برده شده تا تناسب متن حفظ گردد. اغلبِ اصطلاحات مخفف شده به صورت اخیر آورده شدهاند. البته در فصلهای مرتبط با برنامهنویسی به لحاظ نوع مطلب شیوهی دیگری متناسب با محتوای آنها به کار گرفته شده است. در مجموع ضمن آن که تلاش شده مطلب به صورت واضح بیان گردد فراهمآورندهی این نوشتار تلاش برای ارائهی اصطلاحات درست فارسی و رعایت قوانین این زبان توانمند را همواره در نظر داشته است.
با وجود آن که طراحی سیستمهای تشخیص گوینده مدتهاست مد نظر کارشناسان قرار دارد و با وجود ارائهی نتایج بسیاری از این تحقیقات به صورت سیستمهای تجاری، هنوز سیستمی که بتواند مستقل از محیط و نوع آموزش کاربران عملکرد مناسبی داشته باشد ارائه نشده و این زمینه هنوز هم به عنوان یک افق علمی باز و دارای زمینهی تحقیقاتی فراوان مطرح میباشد. با وجود آن که محدودیتهای زمانی و … مانع از ارائهی یک کار دلخواه فراهمآورندهی این نوشتار و استاد راهنمای محترم شد امیدواریم این نوشتار بتواند مقدمهای برای انجام کارهای کاملتر فراهم آورد ضمن آن که علاوه بر موضوع طراحی سیستمهای تشخیص گوینده بسیاری از مطالب این نوشتار میتوانند مقدمهای کاملاً ارضا کننده و مناسب برای افراد علاقمند به طراحی سیستمهای تشخیص صحبت فراهم آورند.
امید است که تلاشهای فراهمآورندهی این نوشتار و زحمات بیدریغ استاد راهنمای محترم بتواند پیشزمینههای لازم برای ارائهی کارهای کاملتر در نوع خود را فراهم آورد.