Superwhisper vs VoiceInk 比較 — オンデバイス音声入力でどっちを選ぶ?

Superwhisper と VoiceInk は、どちらもオンデバイス処理を強みにした Mac 向け音声入力アプリです。設計思想は対極で、片や $249.99 Lifetime で多OS対応の万能型、片や $25 買い切りで Apple Silicon Mac 限定のオープンソース型。
結論から:
- Apple Silicon Mac 一台で個人利用・コスト最優先なら VoiceInk Solo($25 lifetime)
- Intel Mac 含む複数Mac・カスタマイズ最優先なら Superwhisper Lifetime($249.99)
- 日本語の同音異義語・敬語・句読点・開発用語を統合対応するなら Hanaseru(日本語特化)
本記事では両アプリを 6 観点で比較し、加えて 「オープンソース vs クローズドソース」 の選択軸を独立セクションで掘り下げます。両者ともローカル処理で土俵は同じ。環境・コスト・透明性・法人対応のどれを最優先するかで決まります。
本記事は Hanaseru の公式ブログです。Hanaseru の紹介を含みますが、各社が優れる場面も明記し、公式情報・第三者ベンチマーク・学術論文を分けて扱います。
オンデバイス型音声入力の2社比較
AI 音声入力市場のディクテーション系には、クラウド型(Aqua Voice / Wispr Flow)とオンデバイス型(Superwhisper / VoiceInk / MacWhisper)の二系統があります。本記事ではオンデバイス型の代表 2 社 Superwhisper と VoiceInk に絞って比較します。
両者の共通点:
- whisper.cpp 系のローカル AI モデルを使い、ネットワーク不要でディクテーション完結
- Apple Silicon の Neural Engine を最大活用
- データを外部に送らないプライバシー優先設計
- macOS をメイン環境とする(VoiceInk は macOS のみ)
しかし設計思想は対極です:
- Superwhisper = $249.99 Lifetime で買い切り、複数モデル切替・カスタムプロンプト深掘り・Mac/Windows/iOS の全対応。全方位な万能型
- VoiceInk = $25 から買い切り、Apple Silicon Mac 限定、オープンソース(GitHub 公開)で Smart Modes/Power Mode により日常使いを最適化
クラウド型と比較したい場合はAqua Voice vs Superwhisper の比較記事、VoiceInk vs Aqua Voice の比較記事もあわせてご覧ください。

Superwhisper の特徴と思想
アーキテクチャと思想
Superwhisper は個人開発者によるオンデバイス音声入力アプリで、OpenAI の whisper.cpp をベースにしています。macOS-first 設計で Apple Silicon Neural Engine を最大活用し、ネットワーク不要のディクテーション環境を実現します。
設計の核は 「コア機能のカスタマイズ自由度」:
- モデル選択の自由度: Nano(最速・低精度)から Ultra V3 Turbo(高精度・ローカル)まで複数のローカルモデルを切替可能、日本語ユーザーには Ultra V3 Turbo 推奨
- Custom Mode(カスタムプロンプト): 職種・用途別の出力ルールを自由に書ける(医療現場向け / Slack カジュアル / コード支援 等)
- API key 連携: Cloud と Local の AI モデルを無制限利用(Pro 以上)
主要機能と料金
| プラン | 価格 | 主な機能 |
|---|---|---|
| Free | $0 | Free tier features 永久利用、Pro 機能 15分試用 |
| Pro Monthly | $8.49/月 | 全 Pro 機能、API key 連携、無制限 |
| Pro Yearly | $84.99/年(月割 $7.08) | 同上、2ヶ月分割安 |
| Pro Lifetime | $249.99 one time(公式「Top choice」) | Pro 機能を生涯利用、30日返金 |
| Enterprise | 要問合せ | SOC 2 Type II certified、集中課金、Model access control、Enterprise hosted models、Volume discounts |
学割40% off、30日返金保証。Mac/Windows/iOS で利用可能。
出典: Superwhisper 公式(取得日 2026-05-19、Pricing カードを fact-check 済)
強み・弱み
強み:
- 完全オフライン動作(macOS、Apple Silicon でローカルモデル使用時)
- $249.99 Lifetime 買い切りで 3 年以上利用すれば月額/年額より大幅割安
- カスタムプロンプトで職種別調整可、モデル選択も柔軟
- macOS / Windows / iOS 全対応(Windows は実質クラウドモード前提)
- Enterprise で SOC 2 Type II + 集中課金 + Model access control
- whisper-large-v3 ベースなので、日本語の独立 CER データが学術論文・専門メディアで豊富
弱み:
- Windows はローカルモデル未対応(v1.0.6 時点、公式ヘッダーでは Windows 対応と表記するが、ローカルモデル機能は Apple Silicon 限定)、加えて Clipboard 復元・Speaker 分離・Models Library・Auto Mic Volume・FileSync も未対応
- レイテンシ 1000-2400ms(オンデバイス処理のためハードウェア依存)
- 日本語 UI なし
- オープンソースではない(コード監査不可)
- デフォルト精度はカスタムプロンプトなしだと whisper の素の性能まま
出典: Superwhisper Windows ドキュメント
VoiceInk の特徴と思想
アーキテクチャと思想
VoiceInk は個人開発者 Pax(@JoshiPax)が開発する macOS 専用のローカル AI ディクテーションアプリです。オープンソース(GitHub 公開、★約 5,000、2026-05-19時点)で、Apple Silicon の Neural Engine を活用したローカルモデルを使います。
公式は具体的なモデル名を明示していませんが、whisper.cpp 系のオープンソースモデルをベースにしている設計と推測されます。
設計の核は 「日常使いの最適化」:
- Smart Modes: Email / Tweet / Chat / Custom の用途別テンプレで出力を切替
- Power Mode: アクティブアプリ・URL を自動検出して Smart Modes を自動切替
- Voice Assistant: Hey Assistant モードで音声操作
- Personal Dictionary: カスタム語彙登録
主要機能と料金
| プラン | 価格 | 端末数 |
|---|---|---|
| Solo | $25 buy-once | 1 macOS デバイス |
| Personal | $39 buy-once | 2 macOS デバイス |
| Extended | $49 buy-once | 3 macOS デバイス |
- 14 日間返金保証、7 日間無料トライアル
- Lifetime updates(将来のアップデートも追加課金なし)
- iOS 版あり(別契約)
- システム要件: Apple Silicon Mac(M1 以降)、macOS 14.0 以降
出典: VoiceInk 公式(取得日 2026-05-19、Pricing 再フェッチ済)、VoiceInk GitHub
強み・弱み
強み:
- $25 から買い切り、Superwhisper Lifetime $249.99 の約 1/10
- オープンソースでコード監査可能、カスタムビルドも可能性あり
- 完全オフライン処理、プライバシー優先
- Smart Modes / Power Mode で文脈別の出力切替が便利
- 100超言語対応(自社公称)
- 開発者がアクティブで、Discord でユーザーフィードバックを継続的に反映
弱み:
- macOS Apple Silicon 限定(M1 以降、macOS 14.0+)— Windows / Intel Mac / Android 非対応
- 個人開発(法人 SLA、SOC 2、HIPAA、SSO 非対応)
- 日本語独立検証データなし(99% accuracy は自社公称)
- OpenASR Leaderboard 等の独立第三者ベンチマーク参加なし
- Teams / Enterprise プランなし(Extended の 3 デバイスが上限)
- カスタムプロンプトの自由度は Superwhisper より低い(Smart Modes 内のカスタムまで)
6観点で並べる比較
認識精度
| エンジン / 検証 | 数値 | 出典 |
|---|---|---|
| Superwhisper(whisper-large-v3、Common Voice 9) | 日本語CER 9.4% | Radford et al. ICML 2023 arXiv:2212.04356 |
| Superwhisper(同、FLEURS) | 日本語CER 6.4% | 同上 |
| Superwhisper(同、言語処理学会2024検証) | 日本語CER 4.9% | 言語処理学会2024年大会論文 |
| Superwhisper(whisper-large-v3 faster、AI Shift TEDxJP-10K) | 日本語CER 13.6% | AI Shift Tech Blog |
| VoiceInk(自社公称) | 99% accuracy | VoiceInk公式、独立検証なし |
重要:
- Superwhisper は whisper-large-v3 ベースなので、独立した第三者検証で日本語 CER データが豊富(条件により 4.9〜13.6% の幅、平均 10% 前後)
- VoiceInk は OpenASR Leaderboard 等の独立ベンチマーク参加なし、日本語独立検証データもなし
- 同じ whisper 系統が推測される VoiceInk も近似精度と思われますが、独立検証で実証できているのは Superwhisper のみ
レイテンシ・応答速度
| アプリ | 通常レンジ | 計測根拠 |
|---|---|---|
| Superwhisper(Ultra V3 Turbo) | 1000-2400ms | Zenn 河畑記事 2026-02 |
| VoiceInk | 公式「instantly」(独立計測データなし) | Apple Silicon 性能に依存 |
両者ともローカル処理のため Apple Silicon の性能に依存します。VoiceInk は新しい設計で軽量化されている可能性がありますが、独立計測データはなく断定できません。実体感は同等レベルと推測されます。
機能・カスタマイズ性
| 観点 | Superwhisper | VoiceInk |
|---|---|---|
| Custom Mode(プロンプト書き換え) | ◎(自由度高、職種別調整可) | ○(Smart Modes Custom) |
| モデル選択 | ◎(Nano〜Ultra V3 Turbo + API key でクラウド) | △(公式に明示なし) |
| カスタム辞書 | ○ | ✅ Personal Dictionary |
| アプリ自動検出・切替 | △ | ✅ Power Mode(URL/アプリ検出) |
| 音声操作・アシスタント | △ | ✅ Voice Assistant(Hey Assistant) |
| ファイル文字起こし | ◎(Pro で D&D 対応) | △(要確認) |
| 日本語 UI | × | × |
→ Superwhisper は「コア機能のカスタマイズ自由度」、**VoiceInk は「文脈別の出力テンプレ + アプリ連携」**で設計思想が違います。深掘り調整したいなら Superwhisper、日常使いの利便性なら VoiceInk という棲み分けが明確です。
価格・5年/10年TCO
(2026-05-19 fact-check 済、為替120円/ドル換算)
| プラン | 1年 | 3年 | 5年 | 10年 | 円換算(5年) |
|---|---|---|---|---|---|
| VoiceInk Solo($25 lifetime) | $25 | $25 | $25 | $25 | 約 3,000円 |
| VoiceInk Personal($39 lifetime) | $39 | $39 | $39 | $39 | 約 4,680円 |
| VoiceInk Extended($49 lifetime) | $49 | $49 | $49 | $49 | 約 5,880円 |
| Superwhisper Pro 月額($8.49/月) | $101.88 | $305.64 | $509.40 | $1,018.80 | 約 61,128円 |
| Superwhisper Pro 年額($84.99/年) | $84.99 | $254.97 | $424.95 | $849.90 | 約 50,994円 |
| Superwhisper Lifetime($249.99) | $249.99 | $249.99 | $249.99 | $249.99 | 約 29,999円 |
| (参考)Hanaseru Pro 年払い($74.99/年) | $74.99 | $224.97 | $374.95 | $749.90 | 約 44,994円 |
主張:
- コスト最優先なら VoiceInk Solo $25 が圧勝(Superwhisper Lifetime $249.99 の約 1/10)
- ただし Superwhisper Lifetime には「複数モデル選択・カスタムプロンプト・全機能・全OS対応」の含意があり、単純コスト比較は不適切
- 「Mac 環境のみ + シンプルな日常使い」なら VoiceInk のコスパが高い
- 「カスタマイズ重視 + 多 OS 対応 + Enterprise 可能性」なら Superwhisper Lifetime
Hanaseru の料金はこちらで確認できます。
環境制約
| OS | Superwhisper | VoiceInk |
|---|---|---|
| macOS Apple Silicon | ✅(flagship、Apple Silicon 最適化) | ✅(M1 以降、macOS 14+) |
| macOS Intel | ✅ | ❌ |
| Windows | △(クラウドモードのみ、ローカル不可) | ❌ |
| iOS | ✅ | ✅(別契約) |
| Android | ❌ | ❌ |
→ Intel Mac や Windows 環境を含むなら Superwhisper が現実解(Windows はクラウドモード前提)。Apple Silicon Mac だけなら VoiceInk が選択肢に入る。
法人対応・コンプライアンス
| 観点 | Superwhisper | VoiceInk |
|---|---|---|
| SOC 2 Type II | ✅(Enterprise) | ❌(個人開発) |
| HIPAA | 不明(要 Trust Center 確認) | ❌ |
| 集中課金 | ✅(Enterprise) | ❌ |
| Teams プラン | ✅(Enterprise) | ❌(最大 Extended 3 デバイス) |
| Model access control | ✅(Enterprise) | ❌ |
| Volume discounts | ✅(Enterprise) | ❌ |
→ 法人導入は Superwhisper Enterprise 一択。VoiceInk は個人開発で法人プラン不在のため、組織導入は不可。
オープンソース vs クローズドソース
「ローカル処理だから安心」という選び方には、もう一段の差があります。Superwhisper(クローズドソース)と VoiceInk(オープンソース)で、透明性・継続性・サポート品質のトレードオフが明確に分かれます。
オープンソース(VoiceInk)の利点
- コード監査可能 — 何をしているか自分の目で確認できる、機密データを扱う環境で説明責任を果たしやすい
- 自己ビルド可能性 — ライセンス次第で自分でビルドして使える(GPL 系の場合、フォーク継続も可能)
- コミュニティドリブン — GitHub Issues / Discord で改善要望が反映される速度が速い
- 開発停止リスクの緩和 — 個人開発が止まっても、ソースが公開されているので有志がフォークして継続できる
クローズドソース(Superwhisper)の利点
- 企業品質のリリース管理 — モデル更新・バグ修正のサイクルが整理されている
- Enterprise でのサポート保証 — SOC 2 Type II 取得済、契約ベースで法人サポートを得られる
- 改ざんリスクの低さ — 公式ビルドのみ流通(オープンソースは野良ビルドのリスクあり)
- 継続性は事業者依存 — 撤退すれば代替がないという裏返しのリスクは存在
判断軸
- 個人プライバシー・透明性を最優先 → VoiceInk(オープンソース、コード監査可能)
- 法人・SLA・サポート品質を優先 → Superwhisper Enterprise(SOC 2 Type II)
日本語の業務利用であれば、UI / 同音異義語 / 敬語 / 句読点を統合対応するHanaseruも検討対象に入ります。

ペルソナ別の選び方
Apple Silicon Mac で個人ライター・コスト最優先 → VoiceInk Solo($25)
$25 で生涯利用、Smart Modes + Power Mode で文脈別出力に対応。Mac 1台で日常使いするなら適したコスパです。
Intel Mac 含む複数 Mac・カスタムプロンプト最優先 → Superwhisper Lifetime($249.99)
Intel Mac サポート + 複数モデル選択 + 深いカスタムプロンプト。$249.99 で長期利用するなら 3 年以降は実質ランニングコストなしの感覚で使えます。
Windows ユーザー → Superwhisper(クラウドモード前提)or Hanaseru(Windows版開発中)
VoiceInk は完全に選択肢外。Superwhisper はクラウドモードのみで本領発揮されないため、Windows でローカル処理が必須ならHanaseru の Windows 版を待つのも手です。
プライバシー最優先・コード監査が必要 → VoiceInk
オープンソースで透明性が高く、機密データを扱う個人ユーザー・コンプライアンス重視の自己事業者向け。
法人導入・SOC 2 必須 → Superwhisper Enterprise
VoiceInk には法人プランがないため、組織導入なら Superwhisper Enterprise(SOC 2 Type II + 集中課金 + Model access control)が現実解です。
日本語業務中心 → Hanaseru
日本語特化 UI + 同音異義語の自動補正 + 句読点の自動挿入 + 開発用語辞書(2,001 語 39 カテゴリ)。敬語自動変換は今後の対応予定です。英語ベースの汎用ツールでは構造的に対応しきれない領域に踏み込んでいます。
まとめ
Superwhisper と VoiceInk は、同じオンデバイス処理でも設計思想が対極です。
- Superwhisper = $249.99 Lifetime・多 OS 対応・カスタマイズ深掘り・Enterprise 可能。全方位な万能型
- VoiceInk = $25 買い切り・Apple Silicon Mac 限定・オープンソース。Mac 日常使いで最もコストパフォーマンスが高い選択肢
「Intel Mac か?」「カスタマイズ深掘りしたいか?」「法人導入か?」のいずれかが Yes なら Superwhisper、すべて No で Apple Silicon Mac 1 台なら VoiceInk が現実解です。日本語業務中心なら Hanaseru も検討してください。
よくある質問
Superwhisper と VoiceInk、英語精度はどちらが上?
両者とも whisper.cpp 系のローカルモデルがベースと推測されるため、英語精度はほぼ同等です。Superwhisper は OpenAI whisper をベースとし、検証条件により Common Voice 9 で 9.4%、FLEURS で 6.4% などの公開 CER データが豊富(arXiv:2212.04356)。VoiceInk は「99% accuracy」と公称しますが独立検証データはありません。独立検証で確認できる精度データは Superwhisper のほうが透明性が高いといえます。
日本語精度はどちらが上?
ベースモデル(whisper-large-v3)が同じと推測されるため、両者とも日本語 CER 4.9〜13.6% 程度の幅と推定されます(検証条件・モデル選択次第)。日本語独立検証データは Superwhisper のほうが公開ベンチマークで検証可能です。日本語特化の選択肢としてはHanaseru の 14 日間無料トライアルも検討してください。
5年使うとどれくらいコスト差が出る?
VoiceInk Solo $25 lifetime × 1 = $25、Superwhisper Lifetime $249.99 × 1 = $249.99。約 10 倍の差です。10 年でも同じ($25 vs $249.99)。ただし Superwhisper Lifetime には複数モデル選択・カスタムプロンプト・複数 OS 対応の含意があり、単純比較ではなく「機能 / 環境要件」で選ぶべきです。
VoiceInk は Windows で使える?
使えません。VoiceInk は macOS 14.0 以降の Apple Silicon Mac 限定です。Windows ユーザーは Superwhisper(クラウドモードのみ)、Aqua Voice、Wispr Flow、Hanaseru(Windows 版開発中)が選択肢になります。
法人導入はどっちが向く?
Superwhisper Enterprise 一択です。SOC 2 Type II 取得済、集中課金とモデルアクセス制御、Volume discounts が提供されます。VoiceInk は個人開発で Teams / Enterprise プランがなく、SOC 2 / HIPAA 等のコンプライアンス対応もありません。
日本語特化のアプリは他にある?
Hanaseru が日本語特化の AI 音声入力アプリです。同音異義語の自動補正、句読点の自動挿入、開発用語辞書(2,001 語 39 カテゴリ)、完全日本語 UI を備えています。敬語自動変換は今後の対応予定です。英語ベースのアプリでは構造的に対応しきれない領域に踏み込んでいます。14 日間無料で試せます→
関連記事
別の競合との比較記事もあります:
- Aqua Voice vs Superwhisper 比較 — 日本語精度で選ぶならどっち? — クラウド型 vs オンデバイス、機密情報を扱うときの選び方
- VoiceInk vs Aqua Voice 比較 — 買い切り$25とサブスクどっちが得? — 5年で19倍のコスト差と Apple Silicon Mac 限定の壁
- Wispr Flow vs Superwhisper 比較 — 日本語ユーザーの正解 — 100 言語汎用 vs オンデバイス、Windows 対応の差
- Aqua Voice vs Wispr Flow 比較 — 法人導入で選ぶ基準 — クラウド型 2 社の対比、HIPAA/SOC 2/SSO で選ぶ法人視点
参考文献
公式ドキュメント
- Superwhisper 公式(取得日: 2026-05-19、Pricing カードを fact-check 済)
- Superwhisper Windows ドキュメント
- VoiceInk 公式(取得日: 2026-05-19、Pricing 再フェッチ済)
- VoiceInk GitHub(取得日: 2026-05-19、★約 5,000)
- VoiceInk Documentation
学術論文・第三者ベンチマーク
- Radford et al., "Robust Speech Recognition via Large-Scale Weak Supervision", ICML 2023, arXiv:2212.04356
- 言語処理学会2024年大会論文「複数言語コードを含む発話転写と話者分離」
- AI Shift Tech Blog「kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた」
- Zenn 河畑祐輝「2026 年 AI 音声入力比較」 2026-02-09
本記事は Hanaseru の公式ブログです。Hanaseru の紹介を含みますが、各社が優れる場面も明記し、公式情報・第三者ベンチマーク・学術論文を分けて扱います。記載内容は 2026-05-19 時点の公開情報・公式公称値・独立第三者ベンチマークに基づきます。価格・機能は変更されることがあるため、購入時は各社の公式サイトで最新情報を確認してください。