くんすとの備忘録

プログラミングや環境設定の覚え書き。

commコマンドのつかいかた

昨日のシェル芸ヴェンキョウカイ(問2)で話題になった、commコマンドについて。
自分はたまたま先週使ったことがあって知ってたんですが、シェル芸ヴェンキョウカイで初めて知った!っていう人もいたみたいだし、せっかくなので使い方をまとめておきます。

内容

commコマンドとは

名称

comm − 2つのファイルの共通な行もしくは共通でない行を出力する

書式

comm [−123i] file1 file2

解説

comm ユーティリティは、 file1 と file2 を読み込んで(辞書的にソートされて いる必要があります)、 3 つのテキストカラムを出力します: それぞれ、 file1 のみにある行; file2 のみにある行; 両方のファイルにある行です。

オプションなしで試してみましょう。

  • file1
% sort a
分倍河原
川崎
谷保
鹿島田
  • file2
% sort b
分倍河原
南多摩
登戸
谷保

ソートしてcommに食わせます。

% comm <(sort a) <(sort b)
                分倍河原
        南多摩
川崎
        登戸
                谷保
鹿島田

3列の出力が得られます。空の部分には、1列につき1つのtab(\t)が詰まっています。

各列の意味は

  • 1列目 … file1 のみにある行
  • 2列目 … file2 のみにある行
  • 3列目 … 両方にある行

となっています。

オプション

  • -1オプション … 1列目を表示しない (2列目と3列目を表示)
  • -2オプション … 2列目を表示しない (1列目と3列目を表示)
  • -3オプション … 3列目を表示しない (1列目と2列目を表示)

組み合わせも可能で、

  • -12オプション … 1列目と2列目を表示しない (3列目だけ表示)
  • -13オプション … 1列目と3列目を表示しない (2列目だけ表示)
  • -23オプション … 2列目と3列目を表示しない (1列目だけ表示)
  • -123オプション … 1列目と2列目と3列目を表示しない (何も出さない)

となります。

オプションの実行例

  • 2列目を表示しない (1列目と3列目を表示)
% comm -2 <(sort a) <(sort b)
        分倍河原
川崎
        谷保
鹿島田
  • 1列目と2列目を表示しない (3列目だけ表示)
% comm -12 <(sort a) <(sort b)
分倍河原
谷保

スキップされた列・行は詰められるみたいです。


以上!

広告