Wisper(OpenAI開発の音声認識モデル)で文字起こしをします

音声データをテキスト化します。文字起こし作業の準備にどうぞ。

INOUEHIDEAKI

業務内容

OpenAIによって開発された音声認識モデル「Whisper」を使ってmp3等の音声データを文字にしてテキストファイルに出力してお渡しします。雑音が無くクリアな理想的な条件下では、精度は90%を超えることがありますが、人手による確認や修正をして頂くこと前提にしております。私が行えるのは「Whisper」によるテキスト化の部分のみです。

【Wisperの概要】
「Whisper」とは、OpenAIによって開発された先進的な音声認識モデルです。このモデルは、多言語に対応しており、高い精度で音声をテキストに変換する能力を持っています。Whisperの特徴や使用方法について詳しく説明します。

主な特徴
多言語対応: Whisperは多くの言語を認識でき、その精度は一般的な英語の音声認識だけでなく、世界中の多様な言語に対しても高いレベルを保っています。

高精度: 高度な機械学習技術を活用しており、さまざまなアクセント、方言、雑音が含まれる環境でも効果的に機能します。

【Wisperの精度について】
Whisperモデルの日本語における文字起こし精度は、環境がクリアである場合(つまり、背景ノイズが少なく、話者がはっきりと発声している場合)においては非常に高いです。一般的に、このような理想的な条件下では、精度は90%を超えることが期待されますが、100%に達するわけではありません。

精度に影響を与える要因:
発話の明瞭さ: 話者が明瞭に発話している場合、認識精度は向上します。

専門用語や固有名詞: 専門用語や固有名詞が多いと、認識の難易度が上がることがあります。

話者のアクセントや方言: 標準的な日本語よりも方言が強い場合、認識精度が低下する可能性があります。

理想的な条件下での高精度は、ビジネスでの利用においても非常に有効ですが、最終的なテキストの利用目的に応じて、人手による確認や修正を行うことで、より高い品質を保証することが推奨されます。

基本料金

プラン
10,000

ベーシック

音声データをテキスト化します。10時間まで。
20,000

スタンダード

音声データをテキスト化します。20時間まで。
30,000

プレミアム

音声データをテキスト化します。30時間まで。
納期
7 日
7 日
7 日
合計
10,000円
20,000円
30,000円

出品者

INOUEHIDEAKI
INOUEHIDEAKI (inouesysworks)

業務系アプリケーション開発、業務用ツール開発、スクレイピング、自動化、DX、IT全般お任せ下さい

SE歴20年以上。業務系Webアプリケーション、Windowsアプリケーションの設計や実装をしてきました。
Java、C#、PHP、Python、Node.js、Reactなどでソフトウェアを作成できます。
現在はフリーランス(フルスタックエンジニア)として活動。
Webアプリケーション開発、スクレイピング、業務タスクオペレーション自動化、スプレッドシート作成(GAS対応含む)、ExcelVBA、CSV等のフォーマット変換を得意としています。
→法人向け業務系Webアプリケーションの開発ご依頼ください。
→タスクの自動化、業務の自動化ご依頼ください。
→CSV等のフォーマット変換ご依頼ください。
→CMS運用支援、ノーコード開発支援ご依頼ください。
その他、お気軽にご相談ください。

▼可能な業務/スキル
・ご要望のヒアリング、ご提案
・システムの設計、プログラミング、テスト
・Webスクレイピング
・bot開発(Webブラウザ自動操作)
・MySQL等DB設計、構築
・各種管理用Googleスプレッドシート作成(関数、Google Apps Scriopt対応)
・Excel VBA、マクロ作成
・その他、システム開発、プログラミングに関わること
・タスクの自動化システム製造(Selenium、chrome拡張機能、Windows Automation API)
・業務系Webアプリケーション開発

▼資格
・基本情報処理技術者
・ITILファウンデーション

▼実績例
・スクレイピングツール開発
・Chrome拡張機能作成
・Webサイト開発
・業務系Webアプリケーション開発
・Androidアプリ作成
・ビデオチャット、テキストチャットシステム開発
・EXCEL&VBA業務ツール作成
・各種システム設計&コーディング

法人からのご依頼歓迎します。

▼活動時間/連絡について
平日 9:00-18:00
土日祝 不定期

#
プログラミング
プログラマー
システム開発
RPA
スクレイピング
Selenium
Chrome拡張機能
業務アプリケーション
Notion
bot
自動化
レスポンシブ
jquery
ssl
Let’s Encrypt
DX
IT化
html,css,javascrip
データ入力
VBA
2024-10-10

注文時のお願い

・お見積りの流れ
1.音声データの詳細(ファイル数、時間)をお伝え頂く。
2.納期の希望

・注文時
1.音声データの送付(チャットに添付)
2.専門用語の指定(0~30個程度)
※必ずしも専門用語がテキストに反映されるわけではありません。

・納品
お客様にテキストファイルをお渡しする。
※1週間ほどかかりますがなるべくご希望に応えられるように尽力します。