قسمت قبلي

 

فهرست مطالب

صفحة فعاليتها

 

 

 

 

 

 

 

 

ضميمة 2- فهرستي از منابع براي مطالعة بيشتر

 

 

 

 

 

 

 

 

در اين بخش فهرستي از منابع اينترنتي را كه در جريان انجام پروژه با آنها برخورد داشته‌ايم و ممكن است براي علاقمندان به موضوع مفيد باشند ضميمه كرده‌ايم.

اشاره مي‌شود كه بسياري از اين منابع در جريان انجام پروژه مورد استفاده قرار نگرفته‌اند و منابعي كه از آنها استفاده شده محدود به آن فهرستي است كه در فهرست منابع در آخر اين نوشتار و در بخش منابع فصل هر فصل نام برده‌ شده‌اند.

در ضمن زبان برنامه‌نويسي كتابخانه‌ها و برنامه‌ها C مي‌باشد مگر اين صريحاً عنوان شده باشد.

 

1-     سيستمهاي زيست‌سنجي

 

براي سيستمهاي زيست‌سنجي چند اي.پي.آي مهم ايجاد شده است كه مهم‌ترين آنها BioAPI نام دارد كه از طريق سايتي با همين نام http://www.bioapi.org مستندات آن[1] به همراه يك كتابخانه براي ويندوز كه ويژگيهاي آن را پياده‌سازي مي‌كند در دسترس قرار دارد. علاوه بر آن سايت شركت SAFLINK به آدرس http://www.saflink.com نيز اطلاعات قابل توجهي در اين زمينه در اختيار مي‌گذارد.

اي.پي.آي مهم ديگر HA-API [2] نام دارد كه ويرايش دوم رابط برنامه‌نويسي آن در دسترس قرار گرفته است. براي دسترسي به مستندات اين اي.پي.آي و ويژگيهاي چند اي.پي.آي ديگر مي‌توانيد يه سايت http://www.biometrics.com مراجعه نماييد

براي سيستمهاي تشخيص گوينده نيز اي.پي.آيي وجود دارد كه به نظر مي‌رسد اكنون كنار گذاشته شده باشد. اين اي.پي.آي SVApi نام دارد و سايتهاي رسمي آن http://www.svapi.com و http://www.srapi.com طبق اطلاعات به دست آمده اكنون ديگر فعال نيستند ولي مي‌توان به مستندات اين اي.پي.آي از طريق سايت http://www.jmarkowitz.com دسترسي پيدا كرد. در ضمن در سايت شركت ناول (http://www.novell.com) نيز اطلاعاتي در اين مورد قرار داده شده است.

 

2-     پردازش سيگنال

 

در سايت http://www.dspguide.com يك كتاب كامل پردازش سيگنال به صورت رايگان و به قلم استيون دبليو. اسميت[3]  قرار داده شده كه منبع اصلي قسمتهاي مرتبط با پردازش سيگنال در نوشتار ما نيز بوده است.

علاوه بر آن در صورتي كه بخواهيد الگوريتهماي مدلسازي سيگنال را خودتان پياده‌سازي كنيد نياز به آن داريد كه الگوريتم اف.اف.تي را به طور مستقيم به كار ببريد. در سايت http://www.relisoft.com چندين مقالة آموزشي به همراه برنامه‌هاي قابل استفاده قرار داده شده است كه ممكن است مفيد باشد. يك كتابخانة بسيار پر استفاده (از نظر اين كه در بسياري از برنامه‌هاي داراي كد باز پردازش صحبت از آن استفاده شده) نيز براي سيستم‌عاملهاي مختلف از طريق سايت http://www.fftw.org در دسترس قرار دارد. نام اين كتابخانه fftw است و آخرين نسخه‌اي كه ما به آن دسترسي پيدا كرديم نسخة 2.1.3 آن بود علاوه بر آن يك پياده‌سازي به صورت شي‌ءگرا از اين كتابخانه با نام MFFM_FFTw_Wrapper از طريق همان سايت در دسترس قرار داده شده است. (C++)

 

3-    پردازش صحبت

 

خلاصه‌اي از درس توني رابينسون[4] در مورد پردازش سگنال صحبت كه نياز به اطلاعات پيش‌زمينه‌اي آن بسيار كم است و به صورت يك جزوة درسي قابل استفاده است در آدرس http://svr-www.eng.cam.ac.uk/~ajr/SA95/ قرار داده شده است.

يك بحث نسبتاً مفصل از ديدگاه پردازش سيگنال براي كساني كه آشنايي اوليه با اين مبحث دارند در مورد پردازش سيگنال صحبت در اين آدرس  قرار داده شده است.

در سايتي با اين آدرس نيز مجموعة جالبي از سايتهاي مرتبط با اين مبحث قرار داده شده است.

سايت http://www.speech.cs.cmu.edu/comp.speech/ نيز يك سايت رسمي براي مطالب مرتبط با پردازش سيگنال صحبت مي‌باشد. علاوه بر آن گروه خبري[5] news:comp.speech  نيز از منابع اطلاعاتي مهم در اين زمينه به شمار مي‌رود.

 

4-    تشخيص صحبت و تشخيص گوينده

 

در صورتي كه به منبعي براي آشنايي ابتدايي با اين مباحث نياز داشته باشيد مي‌توانيد به  اين آدرس مراجعه كنيد.اين منبع حالتي شبيه به يك سخنراني دارد. فهرستي كه موتور جستجوي گاگل فراهم كرده در اين آدرس قرار دارد و آدرس مجموعه‌اي از سايتهاي مرتبط با موضوع را در اختيار مي‌گذارد. فهرست مشابهي توسط سايت ديماز در اين آدرس قرار داده شده است.

 

5-    نرم‌افزارها و برنامه‌هاي داراي كد باز براي تشخيص صحبت و تشخيص گوينده

 

اسناد و كدهاي مربوط يك پروژة داراي كد باز كه براي سيستمهاي يونيكس طراحي شده و مجموعة ارزشمندي از الگوريتمهاي مدلسازي سيگنال را براي تشخيص صحبت فراهم مي‌آورد در يكي از زيرسايتهاي دانشگاه مي‌سي‌سي‌پي در آدرس http://www.isip.msstate.edu/ قرار داده شده است. اين پروژه هم‌اكنون نيز فعال مي‌باشد و هنوز روي آن كار مي‌شود. در ضمن مجموعة بزرگي از مقالات علمي مرتبط با موضوع در سايت مزبور قرار داده شده است كه ما از تعدادي از آنها در قسمتهاي پردازش سيگنال صحبت و مدلسازي سيگنال كمك گرفته‌ايم.

يك نرم‌افزار مشابه (داراي كد باز) در سايت يك دانشگاه فنلاندي و در آدرس http://cs.joensuu.fi/pages/tkinnu/research/index.html قرار دارد. اين نرم‌افزار با تأكيد بر الگوريتم مدلسازي مقدارگزيني برداري تهيه شده و همانند منبع قبل هم‌اكنون نيز فعال مي‌باشد.

در صورتي كه نياز داريد دموي نرم‌افزارهاي تجاري تشخيص گوينده را مشاهده كنيد در آدرسهاي http://www.anovea.com/ و http://www.spiritcorp.com/ مي‌توانيد چنين دموهايي را بيابيد. اين دموها به خوبي مي‌توانند تواناييهاي فعلي نرم‌افزارهاي تجاري موجود را نشان دهند.

 

 

 

 

 



[1] BioAPI Specificaion Version 1.1, March 16 2001, Developed by The BioAPI Consortium

[2] Human Authentication – Application Programming Interface

[3] Steven W. Smith

[4] Tony Robinson

[5] newsgroup