Web教材一覧ハードウェアとソフトウェア

マルチメディアの取り込み・編集

キーワード

音声認識ソフト、MIDI音源、スキャナー、オーサリングツール

関連:「データ圧縮」


話声

話声の入力
音声・映像端子の写真 身体が不自由な人や手が使いない環境では,キーボードやマウスによるデータ入力やコンピュータ操作ができません。
話声入力は,マイクから音声端子を通して入力されます。端子は,ピン端子,ピンプラグ・ジャックともいいます。パソコン側がジャック,コード側がプラグです。一般に映像端子と音声端子を共通にしています。
そして,アナログ信号をデジタル信号に変換します。しかし,それだけでは単に話声を録音しただけです。文字情報としてコンピュータに理解させるには,音声認識ソフトが必要になります。
音声認識ソフト
音声認識ソフトとは,マイクなどから入力された音声を文字として認識するソフトウェアです。音声には個人差があるので,一定のフレーズをあらかじめ読み上げさせて入力者の特性を記録し,認識精度の向上をします。
読み上げソフト
逆に,Webページ閲覧などで,目の不自由な人のために,文章を読み上げるソフトもあります。

音楽

音楽の入力
オーディオ装置の出力端子からパソコンのサウンドボードの入力端子に接続します。MIDI音源の機器をパソコンに接続するときはMIDIインタフェースを持つ接続機器を用います。
通常のパソコンには,録音や再生の機能を持つチップが搭載されていますが,さらに高性能,多彩な機能が必要なときは,サウンドカード(サウンドボード)という拡張カードを用います。
音楽編集ソフト
音楽の編集をするソフトです。録音した音楽を部分削除したり,音量や音質の調節をしたりできます。作曲ができる機能を持つものもあります。ピアノやシンセサイザなど複数の音源からまとめて入力する場合には,ミキサーという機能があります。

画像

イメージスキャナー
あらかじめ紙に作成された文書や画像をデジタルデータとしてコンピュータに読み込む装置です。画像に光を当てて光の反射をセンサで読み取り,ドットの情報をデジタル信号に変換してコンピュータに入力します。
スキャナの解像度は,プリンタの解像度と同様に,dpi(1インチあたりのドット数)が用いられます。用途により下表程度に設定します。
   画像をディスプレイに表示       72bpi
   細かい文字をディスプレィ表示    150
   領収書などの監査証跡として利用   200
   文字をOCRでテキスト化      300
   写真やネガをサービス判に拡大印刷  300
   写真やネガをA4版に拡大印刷    600
タブレット
タブレットの写真 手書きしながら直接入力する装置で,位置を検出するための板状の装置と位置を指示するペンからなっています。高精度のタブレットをデジタイザといいます。
レタッチソフト
スキャナやデジカメから取り込んだ写真を加工するためのソフトです。画像の拡大・縮小,トリミング,色数や色調の変更,輪郭抽出・ぼかしなど多様な機能を持っています。お絵かきソフトのような簡単なものから,プロ用のものまで多様です。代表的な製品に,Adobe Systems社の「Adobe Photoshop」があります。
OCR(Optical Character Reader)ソフト
スキャナで読み込んだ画像としての文書をデジタル化して文字コードのテキストデータにするソフトです。スキャナの付属ソフトとして提供されるものから,高度な専用のソフトまであります。

映像

ビデオキャプチャ
テレビやビデオの映像信号から画像を取り込む方法です。ビデオキャプチャボード(カード)やビデオデジタイザ(video digitizer)を使ってデジタル化してコンピュータに取り込みます。
オーサリングツール
文字,画像,音声などの複数のマルチメディアデータを組み合わせて編集するツールです。特に動画だけを対象にしたものを動画編集ツールともいいます。
編集機能は、リニア編集とノンリニア編集(補正)に分けられます。リニア編集とは,元となる動画を分割して,不要なものを選んで捨て,必要となる部分を選んで,並び替えたりして編集するツールです。
ノンリニア編集とは,映像をワイプさせたりノイズ除去などのフィルタをかけるなどの,元の動画に変化を加える作業を支援します。
SMIL(Synchronized Multimedia Integration Language)
動画や音声などの多様な形式のマルチメディアコンテンツの再生を制御して同期させるための、XMLベースのマークアップ言語です。どの位置に、どのタイミングで、どのくらいの時間表示するのかなどが制御できます。