AI-Expert-語音轉文字客製化語言服務包
標案名稱114年第一次電腦軟體共同供應契約採購-套裝軟體
組 別8
單 位套
項 次35
採購數量級距1-100
產 地臺灣
評 價
無
產品功能規格
●新資料微調:增強已支援的第一或第二語系之正確率:包括特定背景聲、音質、口音、單字、片語等
●創建專屬訓練資料:提供由公正第三方標註之相關語音之逐字稿訓練資料(語音則由業主提供)
●情境常見詞設定:可設定使用情境下常見的關鍵字,降低誤判率,提升特定情境逐字準確率與關鍵字正確性
●前後文理解:具備前後文理解能力,以優化產出結果,更能符合情境
●支援語系:國語、英語、日語等單一語言,可允許單字或片語的夾雜
●逐字稿:提供逐字稿,並帶有分段戳記
功能規格/基本需求
●語音有效性:業主提供之語音內容必須以非當事人可清楚辨識為主,以確保語音具有一定的可辨識性,例如過度模糊、音量不足、嚴重口音、背景過於吵雜等造成常人無法辨識等則視為不具有效性
●內容相關性:語音內容需要與使用情境類似或是以往情境的錄音結果。
●情境相關性:如音質、背景吵雜程度應與現實情境相符。
●資料多樣性:同一筆資料或大量雷同的資料(例如都是同一位客服與同一位客戶的長時間類似內容的對話)都無法有效提升準確率。不同的客服與不同的客戶之間的不同類型的對話,甚至是不同吵雜度,不同音質,甚至是跨語言的夾雜等,都有助於提升特定情境之準確率。
●資料正確性:將由第三方公正單位進行語音標註,並產出對應的時間戳記與逐字稿,並經由第三方進行兩階段的品管(第一階段相互檢查修正,第二階段由PM抽查修正)直到完成。
●微調之有效性:若訓練資料符合規則,微調後應能提升模型於特定情境下的準確率。
Al-Expert-語音轉文字客製化語言服務包安裝的需求規格:
1. 網路架構具備VPC建立隔離環境,包含子網路配置、網路安全控管等
2. 運算服務具備ECS容器服務,搭配自動擴展及負載平衡
3. 儲存服務具備S3(適用靜態檔案)、EFS(共享檔案系統)及DocumentDB(MongoDB相容資料庫)
4. 透過IAM、CloudWatch等進行存取控制與監控
5. 模型需求:OpenAI Whisper(語音轉文字)、Claude 3.5(語意理解與翻譯)、Titan V2(文字向量)
6. 硬體需求:g2-standard-4規格,配備4核心CPU、16GB RAM及NVIDIA L4 GPU(24GB顯存)