CSVファイルとは?詳しく解説、サンプルデータもあります。

この記事は約 5 分で読めます。

CSVファイルとは、カンマ[,]などの区切り文字で作成されたテキストファイルのことです。「シー エス ブイ ファイル」と読みます。

では、タブで区切られたテキストファイルを何と呼ぶかご存知でしょうか?

これもCSVファイルと呼びます。
ですが、TSVファイルと呼ばれることもあるのです。

スポンサーリンク

CSVファイルとは

CSVファイルとは

一体どちらが正しい呼び方なのでしょうか?

その疑問を解くために、まずは CSVファイル のフォーマット(書式)について理解する必要があります。

CSVファイルのフォーマット(書式)

TSV は、tab(タブ) separated(区切られた) values(値)の略称です。

CSV は、comma(カンマ) separated(区切られた) values(値)の略称ですが、character(文字)separated(区切られた)values(値)という意味でも用いられます。

よって、どちらの呼び方も正解なのです。

仕事でCSVファイルを扱う際は、単純にCSVファイルと言うのではなく、「タブで区切られたCSVファイル」と言う方が賢明です。

なお、使用頻度は劣りますが、半角スペース、セミコロンを区切り文字に用いる場合もあります。

CSVファイルの内容

CSVファイルの中身をテキストエディタで確認すると、このように表示されます。

CSVファイルのサンプルデータ(カンマ区切り)

CSVを表示するためのツールを使って表示した結果がこちらです。
上記リンクをクリックすると、ツールがご利用になれます。

csvfile_sample_viewer

サンプルデータ

文字コード、区切り文字、改行コード別にCSVファイルのサンプルデータを用意しました。ファイル名をクリックするとダウンロードできますのでご利用ください。

ファイル名 文字コード 区切り文字 改行コード
sample_sjis.csv SJIS カンマ[,] CRLF
sample_utf8.csv UTF-8 カンマ[,] CRLF
sample_euc.csv EUC カンマ[,] CRLF
sample_utf8_LF.csv UTF-8 カンマ[,] LF
sample_utf8_tab_LF.csv UTF-8 タブ LF
sample_utf8_space_LF.csv UTF-8 スペース LF
sample_utf8_semicolon_LF.csv UTF-8 セミコロン[;] LF

文字コード

文字コードとは、文字や記号をコンピュータ上で扱うために割り当てられたバイト表現です。簡単に理解するならば、Windowsで使用されている文字コードは大体 SJIS(Shift-JIS)、正確にはそれを拡張した MS932 、Mac や Linux で使用されているのが UTF-8 や EUC です。

そのため、Windowsで作成したテキストファイルをLinuxに転送した結果、うまく表示できず文字化けが発生します。

詳しく知りたい方は以下サイトをご覧ください。

改行コード

改行コードとは、ファイル内のテキスト1行を折り返すために使用する制御コードです。具体的には、Windowsの標準で使用される改行コードは 2バイトの CRLF(キャリッジリターン+ラインフィールド)、Mac や Linux の標準で使用される改行コードは 1バイトの LF(ラインフィールド)です。

詳しく知りたい方は以下サイトをご覧ください。

CSVファイルの使い方

CSVファイルを利用するシーンの一例を以下に示します。

データのエクスポート、インポート

アプリによるCSVファイルのエクスポート、インポートの図

データベースや電話帳アプリ等のエクスポート機能で、CSVファイルを出力します。

エクスポートとは、バックアップや他のアプリへの移行を目的として、保持するデータ(電話番号や氏名)を外部ファイルとして出力する機能です。

エクスポートされたCSVファイルは、互換性のあるシステムやアプリでインポートすることができます。

インポートとは、バックアップされたデータを取り込んで、データ(電話番号や氏名)を復元する機能です。

システム間の連携データ

システムによるCSVファイルによるSFTP通信の図

システム間連携で行われるファイル転送には、FTP や SFTP、FTPS 等がありますが、これらで利用されるファイルフォーマットに CSVファイルが多用されます。

FTPとは、ファイルを転送するための通信プロトコルです。現在ではセキュリティーの問題であまり利用されることはありません。SFTP、またはFTPSを利用した方がよいでしょう。
SFTPとは、FTPで送受信するデータを「SSH」で暗号化するプロトコルです。安全にファイル転送が行えます。
FTPSとは、FTPで送受信するデータを「SSL/TLS」で暗号化するプロトコルです。安全にファイル転送が行えます。

まとめ

CSVファイルは、お手軽、かつ様々な用途に使える、とても強力なファイルフォーマットです。

Windows標準アクセサリのメモ帳だけあれば作成できる点も、大変魅力的です。

現在は、JSON(JavaScript Object Notation)という軽量なデータ記述言語の登場により、以前よりもCSVが利用されなくなった感じもしますが、まだまだ現役です。

スマホでCSVファイルを閲覧できる無料のAndroidアプリ『CSV Viewer』をリリースしてます。是非、サンプルデータをアプリで表示し、CSVの良さを体感してください。

シンプルアップ工房の公開アプリ達を紹介します。 ここで紹介するアプリ達は、会社員 Shira が個人で開発・リリースしたアプリですが、...
The following two tabs change content below.
会社員Shira
IT系の会社員。1978年生まれ。個人開発でAndroidのアプリをリリース、総ダウンロード数は70万くらい。36歳で初めての転職、未経験のweb業界で日々悪戦苦闘してます。
スポンサーリンク
広告
広告

当記事がお役に立ちましたらシェアして頂けると嬉しいです。

フォローする