(SeaPRwire) – BOSTON, MA – 23/03/2026 – (SeaPRwire) – Modulate telah memperkenalkan API bahasa lisan ke teks baharu yang bertujuan untuk mengubah cara organisasi memproses dan memahami audio perbualan secara besar-besaran. Velma Transcribe yang baru dilancarkan disasarkan sebagai penyelesaian transkripsi berprestasi tinggi dan cekap kos yang direka untuk memenuhi permintaan yang semakin meningkat untuk analisis data suara masa nyata merentasi industri, daripada perkhidmatan pelanggan kepada platform sosial dan aplikasi yang didorong AI.
Pelancaran ini menyerlahkan peralihan industri yang lebih luas ke arah menjadikan infrastruktur kecerdasan suara lebih mudah diakses dan berdaya maju dari segi ekonomi. Dengan menurunkan halangan kos untuk transkripsi dengan ketara, penawaran terbaru Modulate membolehkan organisasi memperluaskan penggunaan data suara merentasi julat aplikasi yang lebih luas, termasuk ejen suara masa nyata, saluran analitik, dan platform komunikasi global.
Velma Transcribe dibina berdasarkan Ensemble Listening Model (ELM) Modulate, pendekatan yang didorong penyelidikan yang menyelaraskan pelbagai model transkripsi khusus untuk mengoptimumkan prestasi. Arkitektur berasaskan ensembel ini meningkatkan ketepatan transkripsi, mengurangkan latensi, dan meningkatkan kecekapan kos berbanding sistem model tunggal tradisional. Platform ini telah menunjukkan prestasi yang kukuh dalam piawaian yang diiktiraf secara meluas seperti Earnings-22 dan AMI Meeting Corpus, terutamanya dalam mengendalikan senario perbualan kompleks yang melibatkan pelbagai penutur.
Executif syarikat menekankan bahawa penyelesaian ini melampaui keupayaan transkripsi tradisional. Walaupun banyak sistem hanya fokus pada penukaran bahasa lisan kepada teks, Velma Transcribe menggabungkan pemahaman kontekstual yang lebih mendalam, menyokong julat wawasan perbualan yang lebih luas. Pada masa yang sama, API ini direka untuk kekal mudah diakses oleh pembangun yang memerlukan transkrip pantas dan boleh dipercayai tanpa beban analitik tambahan.
Selain keupayaan transkripsinya, platform ini menggabungkan pelbagai ciri yang memberi tumpuan kepada enterprise, termasuk pengesanan emosi merentasi lebih daripada 20 kategori, pengiktirafan loghat yang merangkumi lebih daripada 20 variasi, dan sokongan berbilang bahasa yang meliputi lebih daripada 70 bahasa. Ia juga termasuk fungsi maju seperti speaker diarization, pengesanan dan penyuntingan maklumat boleh dikenal pasti individu (PII), dan sokongan strim masa nyata untuk aplikasi langsung.
Salah satu aspek yang paling ketara tentang Velma Transcribe ialah model hargaannya. Dengan kos transkripsi diturunkan kepada approximately $0.03 setiap jam audio, platform ini menawarkan pengurangan ketara berbanding kadar pasaran semasa. Struktur harga ini membolehkan enterprise memproses jumlah data suara yang besar dengan lebih ekonomi, membuka peluang baru untuk membuat keputusan berasaskan data dan strategi monetisasi.
Sistem ini direka untuk berprestasi dengan boleh dipercayai dalam persekitaran perbualan dunia sebenar, di mana pertindihan bahasa lisan, gangguan, loghat yang pelbagai, dan hingar latar sering mencabar alat transkripsi konvensional. Keputusan piawaian menunjukkan bahawa Velma Transcribe mengurangkan kadar ralat dengan ketara berbanding beberapa penyelesaian yang sedia ada, mengukuhkan kesesuaiannya untuk pelaksanaan skala enterprise.
Untuk menyokong aplikasi tahap pengeluaran, platform ini termasuk ciri seperti endpoint transkripsi kelompok dan strim, output berstruktur dengan cap masa, latensi sub-saat untuk kes penggunaan langsung, dan polisi pengekalan data sifar yang direka untuk meningkatkan privasi dan pematuhan. Disediakan dengan amalan keselamatan yang disahkan ISO 27001, keupayaan ini meletakkan penyelesaian untuk pelaksanaan selamat dalam persekitaran yang dikawal dan sensitif data.
Velma Transcribe adalah sebahagian daripada suite model kecerdasan suara Velma 2.0 yang lebih luas Modulate, yang bertujuan untuk menyediakan sistem AI dengan “lapisan mendengar” yang lebih maju. Pendekatan ini membolehkan organisasi beralih daripada transkripsi ringkas ke arah pemahaman perbualan yang lebih mendalam, menyokong kes penggunaan seperti pengesanan penipuan, analisis sentimen, pemantauan pematuhan, dan wawasan operasi masa nyata.
Penyelesaian ini tersedia dengan serta-merta, dengan harga berasaskan penggunaan yang direka untuk menampung kedua-dua pelaksanaan skala kecil dan beban kerja enterprise volum tinggi.
Tentang Modulate
Modulate ialah syarikat teknologi kecerdasan suara yang memberi tumpuan kepada pembangunan model AI dan API yang membolehkan pemahaman yang boleh skalakan tentang audio perbualan dunia sebenar. Penyelesaiannya menggabungkan pengiktirafan bahasa lisan, analisis akustik, dan pemprosesan kontekstual untuk menyampaikan kecerdasan suara yang tepat, dapat dijelaskan, dan cekap kos untuk enterprise dan pembangun.
Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.
Sektor: Top Story, Berita Harian
SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.



