مجموعة الكلام

مجموعة الكلام speech corpus (أو النص المنطوق spoken corpus) هي قاعدة بيانات من نسخ ملفات الصوت والنصوص الصوتية.

في تقنية الكلام، تُستخدم مجموعة الكلام، من بين أشياء أخرى، لإنشاء نموذج صوتي (والتي يمكن استخدامها بعد ذلك مع محرك التعرف على الكلام أو تحديد المتحدث).^[1] في اللسانيات، تُستخدم النصوص المنطوقة لإجراء بحث صوتي و تحليل المحادثة و علم اللهجات ومجالات أخرى.

والمجموعة هي إحدى قواعد البيانات هذه. المجاميع هي صيغة الجمع للمجموعة (أي أنها العديد من قواعد البيانات هذه).

هناك نوعان من مجاميع الكلام:

قراءة الكلام - والذي يتضمن:
- مقتطفات من الكتب
- بث الأخبار
- قوائم الكلمات
- تسلسلات الأرقام
الكلام العفوي - والذي يشمل:
- الحوار - بين شخصين أو أكثر (بما في ذلك الاجتماعات);
- الروايات - شخص يروي قصة (إحدى هذه المجموعات هي مجموعة بك آي);
- مهام الخريطة - يشرح شخص ما طريقاً على خريطة لآخر;
- مهام التعيين - يحاول شخصان إيجاد وقت اجتماع مشترك بناءً على جداول زمنية فردية.

نوع خاص من مجموعات الكلام هي قواعد بيانات الكلام غير الأصلية التي تحتوي على كلام بلكنة أجنبية.

انظر أيضاً

^ Sarangi, Susanta; Sahidullah, Md; Saha, Goutam (September 2020). "Optimization of data-driven filterbank for automatic speaker verification". Digital Signal Processing. 104: 102795. arXiv:2007.10729. doi:10.1016/j.dsp.2020.102795. S2CID 220665533.

Edwards, Jane / Lampert, Martin (eds.) (1992): Talking Data – Transcription and Coding in Discourse Research. Hillsdale: Erlbaum.
Leech, Geoffrey / Myers, Greg / Thomas, Jenny (eds.) (1995): Spoken English on Computer: Transcription, Markup and Application. Harlow: Longman.

This article contains content from Wikimedia licensed under CC BY-SA 4.0. Please comply with the license terms.