مقدمه

صنعت کامپیوتر که راهبری سیستمهای اطلاعاتی، مالی و امنیتی نوین را بر عهده دارد برای اعمال کنترل صحیح بر نحوه‌ی دسترسی به سیستمهای یاد شده توسط کاربران، سالهاست که از سیستم ساده‌ی نام کاربر و کلمه‌ی عبور استفاده می‌نماید. با وجود آن که سیستم مزبور از نظر پیاده‌سازی بسیار ساده و کم‌هزینه می‌باشد، به این دلیل که تضمین نمی‌کند شخص دارنده‌ی یک شناسه‌ی مجاز همان شخصی است که شناسه‌ی مزبور برای استفاده‌ی اختصاصی او در نظر گرفته شده، امنیت مورد انتظار برای سیستمهای مهم را تأمین نمی‌نماید. آمار رو به‌فزون تقلبهای کامپیوتری به صورت گذر غیر مجاز از سیستم یاد شده نشانگر این عدم تواناییست که انگیزه‌ی جستجوی جایگزینی مطمئن برای آن را در ذهن متخصصان امر پرورده است.

از سوی دیگر تکنیک استفاده از ویژگیهای منحصر به فرد زیستی انسانها برای بازشناسی آنان دیرزمانیست که در حیطه‌ی جرم‌شناسی به لحاظ باور علمی این مطلب که این ویژگیها غیر قابل تقلید بوده، احتمال مشابهت آنها در افراد صفر یا عددی مشابه آن است به عنوان ابزاری مطمئن و کارآمد مطرح می‌باشد و متخصصان طراحی سیستمهای امنیتی الکترونیکی نیز در دهه‌های اخیر به این فن‌آوری به عنوان مهم‌ترین اساس برای طراحی سیستمهای امنیتی وابسته به فرد خاص نظر داشته‌اند.

اهمیت موضوع یاد شده از یک سو و تازگی آن از سوی دیگر تهیه‌کننده‌ی این نوشتار را بر آن داشت تا با راهنمایی استاد محترم جناب آقای دکتر نقش‌نیلچی موضوع پروژه‌ی پایانی خود را مطالعه بر روی این گونه سیستمها و طراحی یک سیستم امنیتی نمونه بر اساس ویژگی‌های منحصر به فرد صوتی افراد انتخاب نماید که دستاورد آن یک سیستم تشخیص گوینده‌ی وابسته به متن به عنوان نتیجه‌ی عملی و این نوشتار به عنوان فراهم آورنده‌ی پیش‌زمینه‌های علمی و توصیف‌کننده‌ی نحوه‌ی عملکرد آن می‌باشد.

پیش از هر چیز تأکید بر این مطلب ضروری به نظر می‌رسد که این نوشتار نه به عنوان یک مرجع برای موضوع طراحی سیستمهای تشخیص گوینده بلکه به عنوان راهنمایی برای افراد علاقمند به ادامه‌ی این کار فراهم آمده است و از این لحاظ سعی شده که به جای پوشش تمامی روشهای ممکن و ارائه‌ی الگوریتمهایی که در پروژه‌ی عملی کاربردی نداشته‌اند از آنها به صورت اشاره‌وار یاد شود و در عوض زمینه‌های تئوری و روشهای برنامه‌نویسیِ عملاً استفاده شده، به صورت مشروح‌تر بیان شده‌اند. ذکر فهرست منابع هر فصل در پایان آن، توضیح کد توابع استفاده شده و ارائه‌ی پیش‌زمینه‌های نظری و روشهای برنامه‌نویسی برای پردازش صوت به صورت ابزارهایی برای تحقق این هدف به کار گرفته شده‌اند که به نظر می‌رسد نمی‌توانند جایی در بین مطالب یک مرجع برای مطلب یاد شده داشته باشند.

بدنه‌ی اصلی نوشتار از سه بخش تشکیل شده است. بخش اول مقدمه‌ای است بر اهمیت و کاربردهای سیستمهای زیست‌سنجی و به طور خاص سیستمهای تشخیص گوینده. این بخش شامل دو فصل است و مطالب آن عمدتاً مقدمات لازم برای بخش سوم نوشتار را فراهم می‌آورد. در بخش دوم پردازش صوت را به صورت نظری مورد بررسی قرار خواهیم داد و سپس مطالب نظری یاد شده را در قالب یک کتابخانه برای پردازش صوت از دیدگاه برنامه‌نویسی پیاده‌سازی خواهیم نمود. این بخش تا حد زیادی مستقل از دو بخش دیگر نوشتار می‌باشد ولی به لحاظ نوع مخاطب و هدف این نوشتار پرداختن به آن ضروری به نظر می‌رسد. بخش یاد شده نیز شامل دو فصل می‌باشد. بخش آخر که مرتبط‌ترین بخش نوشتار با سیستم عملی است و دربردارنده‌ی چهار فصل است پردازش صحبت را از دیدگاه تئوری و برنامه‌نویسی مورد بحث قرار می‌دهد. بحث با فصلی در مورد پردازش سیگنال صحبت که در واقع به نوعی می‌تواند ادامه‌ی بخش قبل تلقی گردد آغاز می‌گردد و در ادامه مدلسازی سیگنال به عنوان شیوه‌ای برای استخراج الگوهای قابل مقایسه از سیگنال صحبت مطرح می‌شود و در آخرین فصل نظری این نوشتار روشهای مختلف معمول برای طراحی سیستمهای تشخیص گوینده بررسی می‌شوند. نهایتاً در آخرین فصل این نوشتار یک کتابخانه‌ی نمونه‌ی تشخیص گوینده که در پیاده‌سازی قسمت عملی مورد استفاده قرار گرفته است ارائه می‌گردد.

در ضمیمه‌ی اول این نوشتار شیوه‌ی نصب و روش استفاده از سیستم پیاده‌سازی شده مطرح گردیده است و ضمیمه‌ی دوم آن ارائه‌دهنده‌ی فهرست کاملی از منابع متفرقه‌ی اینترنتی یافت شده که بسیاری از آنها به دلایل مختلف در این پروژه مورد استفاده قرار نگرفته‌اند برای خوانندگانی که قصد انجام کاری مشابه با این پروژه را دارند می‌باشند.

با توجه به آن که منابع عمده‌ی این نوشتار، عمدتاً انگلیسی زبان می‌باشند ارائه‌ی معادلهای مناسبِ حتی‌الامکان فارسی برای اصطلاحات علمی که در منابع فارسی معادلی برای آنها یافت نشده سرلوحه‌ی کار فراهم‌آورنده‌ی این نوشتار قرار داشته و به منظور انتقال هر چه بهتر مطلب سعی شده با ارائه‌ی پاورقیها یا توضیحات اضافی، مخاطب نوشتار با اصل اصطلاحات آشنا شود. علاوه بر آن در مواردی که ارائه‌ی واژه به صورت انگلیسی مناسب‌تر تشخیص داده شده واژه با حروف فارسی در متن اصلی به کار برده شده تا تناسب متن حفظ گردد. اغلبِ اصطلاحات مخفف شده به صورت اخیر آورده شده‌اند. البته در فصلهای مرتبط با برنامه‌نویسی به لحاظ نوع مطلب شیوه‌ی دیگری متناسب با محتوای آنها به کار گرفته شده است. در مجموع ضمن آن که تلاش شده مطلب به صورت واضح بیان گردد فراهم‌آورنده‌ی این نوشتار تلاش برای ارائه‌ی اصطلاحات درست فارسی و رعایت قوانین این زبان توانمند را همواره در نظر داشته است.

با وجود آن که طراحی سیستمهای تشخیص گوینده مدتهاست مد نظر کارشناسان قرار دارد و با وجود ارائه‌ی نتایج بسیاری از این تحقیقات به صورت سیستمهای تجاری، هنوز سیستمی که بتواند مستقل از محیط و نوع آموزش کاربران عملکرد مناسبی داشته باشد ارائه نشده و این زمینه هنوز هم به عنوان یک افق علمی باز و دارای زمینه‌ی تحقیقاتی فراوان مطرح می‌باشد. با وجود آن که محدودیتهای زمانی و … مانع از ارائه‌ی یک کار دلخواه فراهم‌آورنده‌ی این نوشتار و استاد راهنمای محترم شد امیدواریم این نوشتار بتواند مقدمه‌ای برای انجام کارهای کامل‌تر فراهم آورد ضمن آن که علاوه بر موضوع طراحی سیستمهای تشخیص گوینده بسیاری از مطالب این نوشتار می‌توانند مقدمه‌ای کاملاً ارضا کننده و مناسب برای افراد علاقمند به طراحی سیستمهای تشخیص صحبت فراهم آورند.

امید است که تلاشهای فراهم‌آورنده‌ی این نوشتار و زحمات بی‌دریغ استاد راهنمای محترم بتواند پیش‌زمینه‌های لازم برای ارائه‌ی کارهای کامل‌تر در نوع خود را فراهم آورد.