فهرستی از منابع برای مطالعه‌ی بیشتر

در این بخش فهرستی از منابع اینترنتی را که در جریان انجام پروژه با آنها برخورد داشته‌ایم و ممکن است برای علاقمندان به موضوع مفید باشند ضمیمه کرده‌ایم.

اشاره می‌شود که بسیاری از این منابع در جریان انجام پروژه مورد استفاده قرار نگرفته‌اند و منابعی که از آنها استفاده شده محدود به آن فهرستی است که در فهرست منابع در آخر این نوشتار و در بخش منابع فصل هر فصل نام برده‌ شده‌اند.

در ضمن زبان برنامه‌نویسی کتابخانه‌ها و برنامه‌ها C می‌باشد مگر این صریحاً عنوان شده باشد.

۱- سیستمهای زیست سنجی

برای سیستمهای زیست‌سنجی چند ای.پی.آی مهم ایجاد شده است که مهم‌ترین آنها BioAPI نام دارد که از طریق سایتی با همین نام http://www.bioapi.org مستندات آن ((BioAPI Specificaion Version 1.1, March 16 2001, Developed by The BioAPI Consortium)) به همراه یک کتابخانه برای ویندوز که ویژگیهای آن را پیاده‌سازی می‌کند در دسترس قرار دارد. علاوه بر آن سایت شرکت SAFLINK به آدرس http://www.saflink.com نیز اطلاعات قابل توجهی در این زمینه در اختیار می‌گذارد.

ای.پی.آی مهم دیگر HA-API ((Human Authentication – Application Programming Interface)) نام دارد که ویرایش دوم رابط برنامه‌نویسی آن در دسترس قرار گرفته است. برای دسترسی به مستندات این ای.پی.آی و ویژگیهای چند ای.پی.آی دیگر می‌توانید یه سایت http://www.biometrics.com مراجعه نمایید

برای سیستمهای تشخیص گوینده نیز ای.پی.آیی وجود دارد که به نظر می‌رسد اکنون کنار گذاشته شده باشد. این ای.پی.آی SVApi نام دارد و سایتهای رسمی آن http://www.svapi.comو http://www.srapi.com طبق اطلاعات به دست آمده اکنون دیگر فعال نیستند ولی می‌توان به مستندات این ای.پی.آی از طریق سایت http://www.jmarkowitz.comدسترسی پیدا کرد. در ضمن در سایت شرکت ناول (http://www.novell.com) نیز اطلاعاتی در این مورد قرار داده شده است.

۲- پردازش سیگنال

در سایت http://www.dspguide.com یک کتاب کامل پردازش سیگنال به صورت رایگان و به قلم استیون دبلیو. اسمیت ((Steven W. Smith)) قرار داده شده که منبع اصلی قسمتهای مرتبط با پردازش سیگنال در نوشتار ما نیز بوده است.

علاوه بر آن در صورتی که بخواهید الگوریتهمای مدلسازی سیگنال را خودتان پیاده‌سازی کنید نیاز به آن دارید که الگوریتم اف.اف.تی را به طور مستقیم به کار ببرید. در سایت http://www.relisoft.com چندین مقاله‌ی آموزشی به همراه برنامه‌های قابل استفاده قرار داده شده است که ممکن است مفید باشد. یک کتابخانه‌ی بسیار پر استفاده (از نظر این که در بسیاری از برنامه‌های دارای کد باز پردازش صحبت از آن استفاده شده) نیز برای سیستم‌عاملهای مختلف از طریق سایت http://www.fftw.orgدر دسترس قرار دارد. نام این کتابخانه fftw است و آخرین نسخه‌ای که ما به آن دسترسی پیدا کردیم نسخه‌ی 2.1.3 آن بود علاوه بر آن یک پیاده‌سازی به صورت شی‌ءگرا از این کتابخانه با نام MFFM_FFTw_Wrapper از طریق همان سایت در دسترس قرار داده شده است. (C++)

۳- پردازش صحبت

خلاصه‌ای از درس تونی رابینسون ((Tony Robinson)) در مورد پردازش سگنال صحبت که نیاز به اطلاعات پیش‌زمینه‌ای آن بسیار کم است و به صورت یک جزوه‌ی درسی قابل استفاده است در آدرس http://svr-www.eng.cam.ac.uk/~ajr/SA95 قرار داده شده است.

یک بحث نسبتاً مفصل از دیدگاه پردازش سیگنال برای کسانی که آشنایی اولیه با این مبحث دارند در مورد پردازش سیگنال صحبت در این آدرس قرار داده شده است.

در سایتی با این آدرس نیز مجموعه‌ی جالبی از سایتهای مرتبط با این مبحث قرار داده شده است.

سایت http://www.speech.cs.cmu.edu/comp.speech نیز یک سایت رسمی برای مطالب مرتبط با پردازش سیگنال صحبت می‌باشد. علاوه بر آن گروه خبری ((newsgroup)) news:comp.speech نیز از منابع اطلاعاتی مهم در این زمینه به شمار می‌رود.

۴- تشخیص صحبت و تشخیص گوینده

در صورتی که به منبعی برای آشنایی ابتدایی با این مباحث نیاز داشته باشید می‌توانید به این آدرس مراجعه کنید.این منبع حالتی شبیه به یک سخنرانی دارد. فهرستی که موتور جستجوی گاگل فراهم کرده در این آدرس قرار دارد و آدرس مجموعه‌ای از سایتهای مرتبط با موضوع را در اختیار می‌گذارد. فهرست مشابهی توسط سایت دیماز در این آدرس قرار داده شده است.

۵- نرم‌افزارها و برنامه‌های دارای کد باز برای تشخیص صحبت و تشخیص گوینده

اسناد و کدهای مربوط یک پروژه‌ی دارای کد باز که برای سیستمهای یونیکس طراحی شده و مجموعه‌ی ارزشمندی از الگوریتمهای مدلسازی سیگنال را برای تشخیص صحبت فراهم می‌آورد در یکی از زیرسایتهای دانشگاه می‌سی‌سی‌پی در آدرس http://www.isip.msstate.edu قرار داده شده است. این پروژه هم‌اکنون نیز فعال می‌باشد و هنوز روی آن کار می‌شود. در ضمن مجموعه‌ی بزرگی از مقالات علمی مرتبط با موضوع در سایت مزبور قرار داده شده است که ما از تعدادی از آنها در قسمتهای پردازش سیگنال صحبت و مدلسازی سیگنال کمک گرفته‌ایم.

یک نرم‌افزار مشابه (دارای کد باز) در سایت یک دانشگاه فنلاندی و در آدرس http://cs.joensuu.fi/pages/tkinnu/research/index.html قرار دارد. این نرم‌افزار با تأکید بر الگوریتم مدلسازی مقدارگزینی برداری تهیه شده و همانند منبع قبل هم‌اکنون نیز فعال می‌باشد.

در صورتی که نیاز دارید دموی نرم‌افزارهای تجاری تشخیص گوینده را مشاهده کنید در آدرسهای http://www.anovea.com و http://www.spiritcorp.com می‌توانید چنین دموهایی را بیابید. این دموها به خوبی می‌توانند تواناییهای فعلی نرم‌افزارهای تجاری موجود را نشان دهند.