メインコンテンツへスキップ
比較・レビュー(更新: 2026/5/3

Aqua Voice vs Superwhisper 比較 — 日本語精度で選ぶならどっち?

aqua voicesuperwhisper音声入力比較AI

日本語のメールやドキュメントを、声で書きたい。そう考えてAqua VoiceとSuperwhisperを検討している方は多いはずです。両アプリは見た目こそ似ていますが、設計思想がまるで異なります

結論から:

  • 速度と文脈適応を最優先するなら Aqua Voice(クラウド処理、最速450ms)
  • オフライン+長期コストを抑えたいなら Superwhisper(オンデバイス、Lifetime $249)
  • 日本語の同音異義語・敬語・句読点を統合対応するなら Hanaseru(日本語特化)

この記事では、両アプリを認識精度・レイテンシ・機能・価格・プライバシーの5観点で比較し、ペルソナ別の最適解を示します。

本記事はHanaseruの公式ブログです。Hanaseruの紹介を含みますが、各社が優れる場面も明記し、公式情報・第三者レビュー・公開ベンチマークを分けて扱います。判断材料として読んでください。

AI音声入力の市場分化 — ディクテーション系と議事録系

AI音声入力ツールは2024年以降、個人ディクテーション系会議録系に二極化しています。同じ「音声を文字にする」でも、目的と最適化軸がまったく違います。

ディクテーション系は、メール・チャット・コード・ドキュメントを手書きならぬ「口書き」する個人の生産性ツール。話す→ほぼ同時にカーソル位置にテキストが挿入される、という体験が中心です。Aqua Voice、Superwhisper、Wispr Flow、VoiceInk、そしてHanaseruがこのカテゴリの主要プレイヤーです。

会議録系は、複数人の会話を後から文字起こし・要約するツール。リアルタイム性よりも、長時間音声の安定認識・話者分離・議事録整形を重視します。Otter.ai、Notta、AmiVoiceがこの領域です。

本記事は前者のディクテーション系の比較に絞ります。

ただし、同じディクテーション系でも、Aqua VoiceとSuperwhisperは土俵が違います。Aqua Voiceは独自モデル「Avalon」をクラウドで動かし、画面の文脈を読み取りながら高速な編集体験を提供します。一方Superwhisperは whisper.cppベースのモデルをオンデバイスで動かし、ネットワーク不要・完全プライバシーを最優先にしています。

「精度がいい」「使いやすい」という単純な軸での比較ではなく、何を最優先するかで答えが変わる領域です。

Aqua Voice の特徴と思想

アーキテクチャと思想

Aqua Voiceは米サンフランシスコの Aqua Voice Inc.(Y Combinator W24出身)が開発するクラウド型のAIディクテーションアプリです。独自モデル「Avalon」を採用し、起動50ms以下・テキスト挿入最速450msというフロー体験を最重要視しています。

特徴的なのは「Deep Context」と呼ばれる仕組みで、画面に表示中のドキュメントやメールをAIが読み取り、固有名詞や専門用語の誤変換を抑える設計です。コードを書いている画面なら開発文脈、ビジネスメールならビジネス文脈、とアプリに応じて出力スタイルが自動で切り替わります

主要機能と料金

プラン 月払い 年払い 単語制限 主な機能
Free $0 $0 生涯1,000語 ベースライン認識、Custom Dictionary 5語まで
Pro $10/月 $96/年(月割$8/月) 無制限 Avalon、カスタム辞書(800語まで)、リアルタイム表示
iOS Pro - $119/年 無制限 iOS音声キーボード(App Store別契約)
Team $15/user/月 $144/user/年(月割$12/user/月) 無制限 集中課金、組織全体のPrivacy Mode
Enterprise 要問合せ 要問合せ 無制限 アナリティクス、管理コントロール

→ 月払いは年払いより約25%割高(年払いは月割$8/月、月払いは$10/月)。学割は.eduアカウントで70%off(Pro年額が約$28.80/年相当)。 出典: Aqua Voice plans page(取得日: 2026-05-03、ログイン後にMonthly/Annual toggleで両価格を確認) 出典: Aqua Voice公式Voibe Aqua Voice Pricing 2026(取得日: 2026-05-02、Windows比較セクションは2026-05-03追記)

強み・弱み

強み:

  • アプリ文脈適応の精度が高く、画面で書いている内容に応じて変換結果が変わる
  • 起動50ms・最速450msの応答(後述のレイテンシ比較参照)
  • 英語のOpenASRリーダーボードでプロプライエタリ#1の WER 6.24(Aqua Voice公式ブログ 2025-10-08)
  • 9to5macのSteve Jobsスピーチ転写テストで Aquaは1エラー、macOS標準は17エラー(9to5mac 2025-08-15)

弱み:

  • クラウド処理のためオフライン動作不可、機密情報を扱う環境には向かない
  • 日本語UIは言語設定変更で対応(ただし起動時に英語に戻る場合があるとの報告あり)
  • 日本語の独立CER検証データが2026年5月時点で公開されていない(Avalonの「公称99.1%」は自社ベンチマーク)
  • Free 1,000語は生涯制限、本格利用にはProの月額課金が必要

Superwhisper の特徴と思想

アーキテクチャと思想

Superwhisperは個人開発者によるOSS寄りのアプリで、オンデバイス処理(Local-First) を哲学にしています。OpenAIの whisper.cpp をベースに、Apple SiliconのNeural Engineを最大活用してネットワーク不要のディクテーション環境を実現します。

特徴はモデル選択の自由度で、Nano(最速・低精度)からUltra V3 Turbo(高精度+ローカル)まで複数のモデルを切り替え可能。日本語ユーザーには Ultra V3 Turbo が推奨されています。

「Custom Mode」というカスタムプロンプト機能があり、職種・用途別の出力ルールを自分で定義できます。例えば「医療現場向けに専門用語を優先」「Slack向けにカジュアルな文体」など、深いカスタマイズが可能です。

主要機能と料金

プラン 価格 利用制限 主な機能
Free $0 月15分まで 全Pro機能を体験可、小型AIモデル
Pro 月額 $8.49/月 無制限 API key連携、全クラウド/ローカルモデル
Pro 年額 $84.99/年(=$7.08/月相当) 無制限 同上、年払いで割安
Lifetime $249 買い切り 無制限 Pro機能を生涯利用可
Enterprise 要問合せ 無制限 SOC 2 Type II、集中課金、モデルアクセス制御

学割40%off、30日返金保証あり。 出典: Superwhisper公式 (取得日: 2026-05-02、Windows比較セクションは2026-05-03追記)

強み・弱み

強み:

  • 完全オフライン動作可能(機密情報を扱う場面で安心)
  • $249のLifetime買い切りで、3年以上使うなら他社より圧倒的に安い
  • カスタムプロンプトで職種・用途別の調整が可能
  • macOS / Windows / iOS すべて対応

弱み:

  • レイテンシは1000-2400ms(後述、ローカル処理のためハードウェア依存)
  • 日本語UIなし(設定画面は英語)
  • Windows版は v1.0.6 時点で機能制限あり(ローカルモデル・お気に入り・クリップボード復元が未対応、出典: Superwhisper Windowsドキュメント)
  • デフォルト精度はカスタムプロンプトなしだとwhisperの素の性能まま

徹底比較 — 5観点で並べる

認識精度

Aqua Voice Avalon の英語ベンチマーク

ベンチマーク Avalon の数値 比較
OpenASR Leaderboard 全体 WER 6.24(#6) プロプライエタリで#1
Avalon 1.5(更新版) WER 5.55 ElevenLabs Scribe V2 とブラインドで76%勝利
AISpeak-10(AI技術用語) 97.4%正答 Whisper Large v3: 65.1% / NVIDIA Canary 1B: 51.5%

出典: Aqua Voice公式「Avalon lands at #6 on OpenASR Leaderboard」 2025-10-08

日本語ASRの独立CERデータ(Superwhisperベース性能の参考)

モデル / 検証 日本語CER 出典
Whisper large-v3(Common Voice 9) 9.4% Radford et al. ICML 2023, arXiv:2212.04356
Whisper large-v3(FLEURS) 6.4% 同上
Whisper large-v3(言語処理学会2024検証) 4.9% 言語処理学会2024年大会論文
Whisper large-v3 faster(AI Shift TEDxJP-10K) 13.6% AI Shift Tech Blog
ReazonSpeech v2 (ESPNet) 9.3% 同上
kotoba-whisper-v2.0 8.4-11.6% kotoba-tech HuggingFace

重要:

  • Aqua Voice の日本語独立検証データは2026年5月時点で公開されていません。Avalonの「公称99.1%」は自社ベンチマークです
  • Superwhisperは whisper-large-v3 ベースで、検証条件により CER 4.9〜13.6% とばらつきます
  • 純粋な「日本語精度の独立比較」を、両アプリ間で同条件で実施した第三者データは存在しません

レイテンシ・応答速度

アプリ 最速 通常レンジ 計測根拠
Aqua Voice 450ms 450-965ms 公式 + Zenn河畑祐輝記事(2026-02)
Superwhisper(Ultra V3 Turbo) ~1000ms 1000-2400ms 同記事(モデル選択次第)
(参考)Wispr Flow - ~1400ms 同記事

Aqua Voiceの最速450msは「ほぼ同時」感覚です。話し終わってから1秒以内にテキストが入ります。Superwhisperはオンデバイス処理のため、M1以降のApple Silicon Macを前提にしても1〜2.4秒程度のラグがあります。

機能・カスタマイズ性

観点 Aqua Voice Superwhisper
アプリ文脈適応 ◎(自動切替) △(カスタムモードで設定)
カスタムプロンプト × ◎(深い調整可)
カスタム辞書 ○(Pro 800語まで) ○(カスタム語彙)
オフライン ×
モバイル対応 △(iOS Pro 別料金) ○(iOS)
ファイル文字起こし × ○(D&D)
日本語UI △(言語設定で切替可、起動時にリセットされる場合あり) ×(英語のみ)

文脈適応は Aqua Voice の自動切替が便利な一方で、Superwhisperはカスタムプロンプトで自由度高く調整できます。

価格 — 5年TCO

(2026-05-02時点、為替120円/ドル換算)

プラン 1年 3年 5年 円換算(5年)
Aqua Voice Pro 月払い($10/月) $120 $360 $600 約72,000円
Aqua Voice Pro 年払い($96/年) $96 $288 $480 約57,600円
Aqua Voice iOS Pro($119/年) $119 $357 $595 約71,400円
Superwhisper Pro 月払い($8.49/月) $102 $306 $510 約61,200円
Superwhisper Pro 年払い($84.99/年) $85 $255 $425 約51,000円
Superwhisper Lifetime($249 買い切り) $249 $249 $249 約29,880円
(参考)Hanaseru Pro 月払い($7.49/月) $89.88 $269.64 $449.40 約53,928円
(参考)Hanaseru Pro 年払い($74.99/年) $74.99 $224.97 $374.95 約44,994円

3年以上使うなら Superwhisper Lifetime $249 が圧倒的最安です。月払いどうしの比較では Hanaseru $7.49/月 が Aqua Voice $10/月より25%安く、Hanaseru の長期コストの優位性が鮮明になります。年払いどうしでも Hanaseru ($74.99/年)が Aqua($96/年)より22%安い水準です。

法人プラン(Aqua Teams/Enterprise・Superwhisper Enterprise)は両社とも要問合せで価格非公開です。

プライバシー・処理場所(プラットフォーム別に注意)

観点 Aqua Voice Superwhisper(macOS) Superwhisper(Windows)
処理場所 クラウド オンデバイス選択可 クラウドのみ(ローカルモデル未対応)
ネットワーク 必須 不要(オフライン可) 必須
音声データの保管 一時分析のみで保存しないと公式記述 デバイス内のみ クラウド経由
第三者LLM経由 OpenAI APIに送信される可能性あり なし(ローカルモード時) あり
暗号化 TLS N/A(ローカル時) TLS

機密情報を扱う環境では macOS版 Superwhisper のオンデバイスが安心です。ただし Windows 版はローカル言語モデル未対応で実質クラウド処理のみになり、オンデバイス優位が失われます(出典: Superwhisper Windows ドキュメント、取得日: 2026-05-03)。Aqua Voice のプライバシー詳細は別記事「Aqua Voiceの安全性は大丈夫?」(公開予定)で深掘り予定です。

プラットフォーム別の差(Mac/Windows/iOS)

同じアプリでも OSごとに体験が大きく変わる領域です。Aqua Voice と Superwhisper では Windows 対応の差が顕著です。

OS Aqua Voice Superwhisper
macOS ◎(完全対応、Apple Silicon・Intel両対応) ◎(flagship、Apple Silicon最適化、ローカルモデル◎)
Windows ◎(macOSと完全パリティ) △(ローカルモデル未対応=実質クラウドのみ) + Clipboard復元/Speaker分離/Models Library 等が未対応
iOS ○(iOS Pro 別料金 $119/年)

Aqua Voice は macOS / Windows で完全パリティ、両環境で同等の体験が得られます。一方 Superwhisper Windows は最大の魅力(オンデバイス処理)が事実上失われるため、Windows ユーザーが Superwhisper を選ぶ場合は実質「クラウドモデルだけ使うAqua Voice の代替」になる点に注意が必要です。Windows でオンデバイス処理が必須な場合、両者ともに不適となります。

出典: Superwhisper Windows docs + Voibe Superwhisper Platform Support 2026

日本語環境での実用性

ここまで認識精度・レイテンシ・価格の比較を見てきましたが、日本語ユーザー特有の課題には両アプリとも踏み込んでいない部分があります。

日本語に固有の3つの難しさ

日本語の音声入力では、以下の課題が同時に発生します。

  1. 同音異義語の判別: 「貴社の記者が汽車で帰社」「公演の効果」「異常と異状」など、文脈を読まないと正しい漢字に変換できない
  2. 句読点の自動挿入: 「、」と「。」の打ち分け、文末判定が難しい
  3. 話し言葉と書き言葉の差: 「えーと」「あの」のフィラー除去、タメ口→敬語への自動変換

英語圏発のアプリは英語で発生しない問題のため、対応が後回しになりがちです。

各アプリの対応状況

項目 Aqua Voice Superwhisper Hanaseru
同音異義語の文脈判別 △(Deep Contextで部分対応) △(カスタムプロンプト次第) ◎(日本語特化AI後処理)
句読点の自動挿入 △(モデル次第)
フィラー除去 × ○(予定)
敬語自動変換(タメ口→ビジネス文体) × △(カスタムプロンプトで設定可能) △(開発予定)
日本語UI △(言語設定で切替可) ×(英語のみ) ◎(完全日本語対応)
開発用語辞書 カスタム辞書(汎用) カスタム語彙 ◎(2,001語39カテゴリ)

出典: 各社公式ドキュメント + Hanaseru内部資料(機能比較表)

Hanaseruチームによる検証指針

弊チームでは「同音異義語30文・敬語20ペア・句読点30文・開発用語30シナリオ」の共通テストセットを用意し、各社製品との比較検証を継続的に実施しています。詳細は音声入力アプリの精度比較記事も参考にしてください。

定量データの一部は記事公開後に追記しますが、設計思想として:

  • Aqua Voice / Superwhisper は多言語汎用を出発点にしているため、英語と同等の日本語対応は構造的に難しい部分がある
  • Hanaseru は日本語ファーストで設計され、UI・辞書・AI後処理のすべてが日本語の課題に最適化されている

「日本語で仕事をする方」にとって、この設計思想の差は使い込むほど効いてきます。

14日間無料で日本語特化のHanaseruを試す→

ペルソナ別の選び方

ライター・編集者なら → Aqua Voice

英語ベースの長文執筆が多い方には、Aqua Voice のフロー体験が向いています。Deep Contextで画面のドキュメントを読み取りながら出力スタイルを自動調整するため、ビジネスメールでもブログ記事でも自然な文体に整います。最速450msの応答も、思考を切らさず書く体験に貢献します。

開発者・プログラマなら → Superwhisper

オフライン動作とカスタムプロンプトを重視する開発者にはSuperwhisperが向きます。$249のLifetimeで継続課金から解放され、Apple Silicon Macでローカル処理できる安心感もあります。コード文脈に最適化したカスタムモードを自分で設定する手間はかかりますが、調整の自由度は最高水準です。

機密情報を扱う企業・士業なら → macOS版 Superwhisper または Hanaseru

医療・法務・金融など、クラウドにデータを送れない業務環境では Superwhisper の macOS版オンデバイスモードが一択です。Hanaseru も機密性に配慮した設計で、企業導入の選択肢になります。Aqua Voice はクラウド処理のため、コンプライアンス要件が厳しい現場では避けた方が無難です。

Windows ユーザーなら → Aqua Voice が無難(または Hanaseru Windows版を待つ)

Aqua Voice は macOS / Windows 完全パリティで、Windows でも Mac と同等の体験が得られます。一方 Superwhisper Windows はローカル言語モデル未対応で、最大の魅力であるオンデバイス処理が事実上失われます(出典: Superwhisper Windows ドキュメント)。Windows でオンデバイス処理を求めるなら現状両者ともに不向きです。Hanaseru も Windows 版を開発中(C#/.NET 8+WPF)。

日本語のビジネスメール・ドキュメントが中心なら → Hanaseru

「同音異義語の修正に時間を取られている」「敬語の調整が面倒」「開発用語(VS Code・Claude Codeなど)の認識が弱い」と感じている方には Hanaseru が向きます。日本語特化の設計で、英語ベースのアプリでは構造的に対応しきれない領域に踏み込んでいます。

14日間無料で試す→ クレカ不要で機能を確認できます。

まとめ

Aqua Voice と Superwhisper は、同じディクテーション系の音声入力アプリでも土俵が違います

  • Aqua Voice = クラウド処理 + 文脈適応 + 速度。英語の長文執筆や開発者向けに高評価
  • Superwhisper = オンデバイス処理 + カスタマイズ性 + Lifetime $249。プライバシーと長期コストを重視

「どちらが優れているか」ではなく、何を最優先するかで答えが変わります。

ただし日本語に特化した使い込みでは、両アプリとも英語圏発の汎用ツールという制約があります。同音異義語・敬語・句読点・開発用語に同時対応する日本語特化の選択肢として、Hanaseruをぜひ試してみてください。

よくある質問

Aqua VoiceとSuperwhisper、日本語の精度はどちらが上?

公称ベースでは Aqua Voice の独自モデル Avalon が高精度を主張していますが、日本語の独立した第三者検証データは2026年5月時点で公開されていません。Superwhisper は whisper large-v3 ベースで、検証条件により日本語CER 4.9〜13.6%とばらつきがあります(言語処理学会2024年論文 / AI Shift TEDxJP-10K)。日本語の認識精度を最優先する場合、両アプリの差は環境とモデル設定に依存し、決定的な優劣は出しにくい状況です。日本語特化の設計を試したい方には、Hanaseruの14日間無料トライアルも選択肢になります。

機密情報を扱う場合はどっちが安全?

Superwhisperのオンデバイスモードが安全です。Aqua Voiceはクラウド処理のため OpenAI APIなど第三者LLM経由の可能性があり、コンプライアンス要件が厳しい医療・法務・金融などには推奨しません。Aqua Voiceの安全性詳細は別記事で深掘り予定です。

Windows版の違いは?

Aqua Voice は macOS / Windows で完全パリティで、両環境で同等の体験が得られます。一方 Superwhisper Windows は公式 docs で「ローカル言語モデルが Windows ではまだサポートされていない」と明記されています(Superwhisper Windowsドキュメント)。これは Superwhisper の最大の魅力であるオンデバイス処理が Windows では事実上失われることを意味します。加えて Clipboard 復元・Speaker 分離・Models Library・Mouse ショートカット・Auto Mic Volume・FileSync も未対応です。Windows でオンデバイス処理を求めるなら Superwhisper は不向きで、Aqua Voice の方が機能的に揃っています(ただし Aqua Voice もクラウド処理のためプライバシー重視なら別途検討が必要)。

5年使うなら結局どれが安い?

Superwhisper Lifetime $249 が圧倒的最安です(5年でも$249のまま、約29,880円)。次点で Hanaseru Pro 年額($74.99×5年 = 約$375、約44,994円)、Superwhisper Pro 年額($425)、Aqua Voice Pro($480)の順。月額単位ではほぼ同水準ですが、長期利用ではLifetimeの優位が大きく出ます。

日本語特化のアプリは他にある?

Hanaseru が日本語特化のAI音声入力アプリです。同音異義語の自動補正、句読点の自動挿入、開発用語辞書(2,001語39カテゴリ)を備えています。敬語自動変換は今後の対応予定です。UI・辞書・AI後処理のすべてが日本語の課題に最適化されています。14日間無料で試せます→

関連記事

別の競合との比較記事もあります:

参考文献

公式ドキュメント

学術論文

  • Radford et al., "Robust Speech Recognition via Large-Scale Weak Supervision", ICML 2023, arXiv:2212.04356
  • 言語処理学会2024年大会論文「複数言語コードを含む発話転写と話者分離」

第三者レビュー


本記事はHanaseruの公式ブログです。Hanaseruの紹介を含みますが、各社が優れる場面も明記し、公式情報・第三者レビュー・公開ベンチマークを分けて扱います。記載内容は2026-05-03時点の公開情報・公式公称値・独立第三者ベンチマークに基づきます。価格・機能は変更されることがあるため、購入時は各社の公式サイトで最新情報を確認してください。