Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)、音声理解、NLP(自然言語処理)、LLM(大規模言語モデル)などのAI開発・研究用途に向けた「日本語・1話者・ビジネス・自己啓発・趣味実用テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。

本データセットは、ビジネス、自己啓発、趣味・実用分野に関する文章を題材に、日本人の話者が一人で朗読した日本語音声と、その発話内容を文字起こししたトランスクリプトで構成されています。業務解説や考え方の整理、手順説明など、知識や概念を言語化する文脈を含む文章が多く収録されており、単なる読み上げ音声ではなく、内容理解を前提とした発話が含まれています。

朗読形式であることから、話者の発話が安定した構成となっており、音声とテキストの対応関係を明確に捉えやすい点も本データセットの構成要素の一つです。長文構造や論理的な文章展開を含む音声が収録されているため、短文中心の音声データでは扱いにくい、文脈理解や情報整理を伴う音声処理の検証にも利用できます。

各音声データには対応するトランスクリプトが付与されており、音声認識精度の評価に加え、音声入力を起点とした意味理解、要約、応答生成など、音声と言語を横断したAIモデルの学習・検証を想定しています。特定の話者による一貫した発話データであることから、話者依存性を排したモデル挙動の確認や、音声表現と文章構造の関係性を分析する用途にも適しています。

本データセットは、Qlean Datasetが提供するオリジナルデータラインナップ「AIデータレシピ」の一つとして提供されており、研究用途から商用AI開発までを見据えた権利処理が行われています。Visual Bankは、GENIAC採択企業として、実務文脈に即した日本語音声・テキストデータの提供を通じ、AI開発現場における基盤モデルの学習および実装フェーズを支援してまいります。

今回提供を開始する「日本語・1話者・ビジネス・自己啓発・趣味実用テーマの朗読音声コーパスとトランスクリプト」の概要

データ種別

音声、テキスト

被写体属性

日本人

データ形式

音声データ:mp3
テキストデータ:txt,json,csv

収録時間

1音声30秒〜160分

音声レート

44.1kHz / 48kHz

対象のシーン

・ビジネス書や自己啓発書、実用書の文章を一人の話者が朗読するシーン

・手順説明や考え方を整理しながら読み上げる朗読シーン

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-037

「日本語・1話者・ビジネス・自己啓発・趣味実用テーマの朗読音声コーパスとトランスクリプト」のユースケースイメージ

音声入力を伴う日本語言語理解モデルの検証
日本語音声を入力とし、内容理解や要約、質問応答を行う音声言語モデルにおいて、ビジネス文書や実用文書を題材とした理解精度や推論挙動の検証に利用できます。

音声とテキストの対応関係に基づくマルチモーダル研究
同一内容の音声とトランスクリプトを用い、音声表現と文章構造の対応関係や、音声情報が言語理解に与える影響を分析する研究に利用できます。

音声対応型業務支援AIの基盤モデル検証
音声入力によって業務知識や手順説明を理解・処理するAIプロダクトにおいて、ビジネス・実用分野の日本語音声を用いた認識・理解性能の評価に利用できます。

音声入力を前提としたLLMファインチューニング
音声から得られた日本語テキストを起点とするLLMに対し、説明文や論理展開を含むデータを用いて、要約生成や回答生成の品質検証に利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。

また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。

Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/

▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup





『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴

すべての被写体から同意取得

既存データは最短1日で納品可能

カスタム撮影・収録・収集による独自データ構築にも対応

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。

また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之

所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F

Visual Bank企業URL:https://visual-bank.co.jp/

アマナイメージズ企業URL:https://amanaimages.com/about/

Qlean Dataset Launches a Japanese Single-Speaker Read Speech Corpus with Transcripts
Long-Form Japanese Speech Data for ASR, Conversational AI, and Language Understanding

Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai), through its subsidiary amanaimages Inc., has released a new dataset under its AI training data solution, Qlean Dataset: a Japanese single-speaker read speech corpus with transcripts for speech- and language-based AI development.

The dataset consists of Japanese read-aloud audio on business, self-improvement, and practical topics, paired with accurate transcripts. The content includes explanatory and instructional material—such as descriptions of work processes, structured thinking, and procedural guidance—reflecting speech intended to convey meaning and knowledge rather than simple narration.

Recorded in a stable read-speech format, the corpus features long-form, logically structured audio that supports evaluation of speech recognition as well as downstream tasks including spoken language understanding, summarization, and response generation. All data is provided as part of Qlean Dataset’s original lineup, AI Data Recipe, and is fully rights-cleared for both research and commercial AI development.

Dataset Overview Japanese Single-Speaker Read Speech Corpus (Business, Self-Development, and Practical Topics)

Data Types

Audio, Text

Speaker Attributes

Japanese

Data Formats

Audio: mp3
Text: txt, json, csv

Recording Length

Per file: approximately 30 seconds to 160 minutes

Sampling Rate

44.1 kHz / 48 kHz

Recorded Scenarios

・A single speaker reading aloud texts from business books, self-development materials, and practical or instructional publications

・Read speech that explains procedures or organizes concepts while being spoken

Sample Details

https://qleandataset.visual-bank.co.jp/en/lineup/pn-037

Use Case Examples

Evaluation of Japanese Speech-Based Language Understanding Models
The dataset can be used to evaluate comprehension accuracy and inference behavior in speech–language models that take Japanese speech as input and perform tasks such as content understanding, summarization, and question answering, using business and practical documents as source material.

Multimodal Research Based on Speech–Text Alignment
By leveraging paired audio and transcripts of identical content, researchers can analyze the relationship between spoken expression and textual structure, as well as the impact of speech information on language understanding.

Applications Validation of Foundational Models for Voice-Enabled Business Support AI
For AI products designed to understand and process business knowledge or procedural explanations via voice input, the dataset can be used to evaluate recognition and comprehension performance using domain-relevant Japanese speech data. LLM Fine-Tuning with

Speech-Derived Japanese Text
The dataset supports quality evaluation for summarization and answer generation by LLMs trained on Japanese text derived from speech, particularly for explanatory content and logically structured narratives.

About Qlean Dataset

Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.

It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.

Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”

By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.

▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en

▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineu





Key Features of Qlean Dataset

About Visual Bank Inc.

Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”

The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.

Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.

CEO: Saneyuki Nagai

Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo

Corporate Site: https://visual-bank.co.jp/en

Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview

WACOCA: People, Life, Style.