【AI読み上げ】Style-Bert-Vits2モデルの学習をAIエンジニアがします

お作りしたモデルをお手持ちの💻️等に入れていただくと、フリーソフトでなりたい声に近づけます!初めての方も安心サポート!

putty
  • putty (admn)
  • シルバー 本人確認済み、受注実績あり、評価が高く活躍中のフリーランスです
  • 3 満足
    0 残念
  • 1 件の仕事を進行中

業務内容

商品タイトル

高品質な日本語特化Style-BERT-VITS2音声モデルを作成します

商品説明

こんにちは!本サービスでは、Style-BERT-VITS2(JP-Extra)を用いた日本語特化のオリジナル音声モデルを作成いたします。最新技術と高品質な学習環境を活用し、感情豊かで自然な音声生成をお手伝いします。

特にご提供いただいた音声データは、こちらでノイズ処理を行いますので、録音環境に自信がない場合でもご安心ください。


サービス内容

  1. 高品質な学習環境
    高性能PCと最新技術を駆使し、正確で滑らかな音声モデルを作成します。納品後は軽量化を施し、標準的なPC環境でも快適に動作可能です。

  2. ノイズ処理をこちらで実施
    ご提供いただいた音声データにノイズが含まれている場合でも、こちらでiZotope RX 11 AdvancedやAdobe Audition, UVR5を使用して最適化します。これにより、録音環境の違いによる影響を最小限に抑え、高精度なモデルを実現します。

  3. 柔軟なスタイル設定
    Style-BERTの自然言語処理技術により、感情や話者スタイルを自由にカスタマイズ可能。文脈から自動で判断してくれます。優しいナレーションから力強いキャラクター声まで、幅広いニーズに対応します。

  4. 日本語特化の精度
    日本語特有のアクセントやイントネーションを自然に再現。違和感のない高品質な音声でプロジェクトの完成度を向上させます。


データの提供について

学習に必要な音声データの条件は以下の通りです:

  • 音声データ(必須):ノイズが多少含まれていても対応可能ですが、以下の条件を満たすとより高精度なモデルが作成できます:
    • 録音環境:静かな場所で録音されたデータが理想的です。
    • 音声長:最低5分以上、可能であれば15〜30分程度が最適です。
    • 音質:サンプリングレート44.1kHz以上、16bit以上を推奨します。

ご利用の流れ

  1. ご依頼内容のヒアリング(目的、スタイル、感情など)。
  2. 音声データの受け取りと確認。ノイズ処理をこちらで実施します。
  3. 高性能PCでの学習・モデル作成。
  4. 完成したモデルを納品し、必要に応じてサポートいたします。

AIボイスチェンジャー RVC 用モデル作成も出品しております。併せてご検討ください!


注意事項

  1. 音声データが低品質な場合、モデルの精度に影響する可能性があります。
  2. 納品物の軽量化済みモデルは標準的なPCで動作可能ですが、特殊なハードウェアやソフトウェアでの動作保証はできません。

ポイント

ノイズ処理を通じて音声を最適化し、高精度な学習を可能にします。これにより、高品質な音声モデルを手軽に手に入れることができます!

ぜひお気軽にご相談ください。あなたのプロジェクトが成功するお手伝いをさせていただきます!

基本料金

プラン
10,000

ベーシック

標準のプランです!Style-Bert-Vits2用のモデルをお作りします!
17,999

スタンダード

ベーシックプランにクオリティ保証をお付けします。
変換音声にご納得いただけない場合、キャンセル機能で全額返金いたします。
23,999

プレミアム

スタンダードプランの保証に加えて、100を超えるエポック数での学習もサポートします。
納期
10 日
10 日
10 日
合計
10,000円
17,999円
23,999円

オプション料金

RVCのモデル
6,999円 / 納期 +10日
音声変換のサポート
2,999円 / 納期 +10日

出品者

putty
putty (admn)

京大で機械学習について学んでいました!現在はハイエンドPCと専用のソフトを使うデザイナーやっています

  • 3 満足
    0 残念
  • シルバー
  • 個人

こんにちは!クリエイティブ業務を中心に、多岐にわたる分野でお手伝いさせていただきます。私は写真のモデル、アンケート回答、Adobeソフトを使用したデザイン業務、そしてホームページ管理などを得意としています。
また、ポートレートの被写体、カメラパーソンとして写真撮影案件にお応えすることも可能です。なるべくラグジュアリーな作品を納品させて頂きます!



実績とスキル:

写真モデル: クライアントのビジュアルプロジェクトに貢献し、ファッション、製品プロモーション、その他の写真撮影で幅広いスタイルに対応可能です。
アンケート回答: 調査・マーケティング向けのデータ収集に迅速かつ正確に対応し、的確なフィードバックや分析を提供します。
Adobeソフトの使用: Photoshop、Illustrator、Premier Pro、After Effects などのツールを駆使して、画像編集、映像制作、グラフィックデザインなどのクリエイティブ業務に対応。
ホームページ管理: WordPressやその他のCMSを用いたサイト構築、コンテンツ更新、SEO対策の知識も豊富です。魅力的でユーザーフレンドリーなウェブサイトの運営をお手伝いします。
ビデオ編集: Premier ProやDaVinci Resolveを使った映像編集経験あり。VTuber用のコンテンツ制作にも携わっています。

追加可能なサービス:

ライティング・翻訳: 日本語から英語、英語から日本語の翻訳、コピーライティングも可能です。SEOに強い記事作成やマーケティング用コピーライティングも承ります。
音声のノイズ除去: iZotope RX11 Advancedに関する知識があり、クリエイティブなプロジェクトに技術的なサポートを提供します。
動画コンテンツの企画・制作: VTuberコンテンツやSNS向けのショート動画の企画、撮影、編集、さらには配信サポートも可能です。


お気軽にお問い合わせください。お客様のプロジェクトを成功に導くため、全力でサポートさせていただきます!
※守秘義務の都合上、記載できない実績もございます。
個別にはお話できるものもございますので、ご興味を持っていただけましたらお気軽にご連絡ください。




どうぞよろしくお願い致します。

注文時のお願い

注文時の注意事項
音声データは高音質なものでご提出ください。音質が不十分な場合、モデルの精度が低下する可能性があります。元の音質が不明瞭な場合はこちらの方で対応できかねますので、ご了承ください。
権利問題を防ぐため、著作権や肖像権をクリアした音声データをご使用ください。
長時間のデータ(30分以上)をご提出いただければ、より高精度なモデルを作成可能です。
学習には高性能なPC環境を使用しますが、納品後のPC環境での使用に関するサポートも承ります(オプションあり)。
モデル作成には数日かかる場合がありますので、納期に余裕をもってご依頼ください。