JCMD報告書(14)


14. 『日本語研究センター報告 第5号』(1998年1月)大阪樟蔭女子大学日本語研究センター

国語国文学分野におけるデータベースソフトの評価
-『ファイルメーカーPro』と『桐』の比較を中心に-

田原広史(大阪樟蔭女子大学)     
中村一夫(大阪樟蔭女子大学非常勤講師)

1.はじめに

 『ファイルメーカーPro』(クラリス社、以下FMp)は、Windows95、MacOSに共通のファイルを作ることができる、現在唯一のデータベースソフトである。また、低価格で、しかもアカデミーパックという優遇制度があり、学生に買わせやすい。12月初めには、ver3からver4へのアップグレードがおこなわれた。ver4では作成したファイルをそのままの形でWeb上へ公開できるという。ここではFMpの特徴を、田原および中村が使っている範囲内で紹介する。また、現在、国語国文学研究者の間で一般的に使われている『桐』(管理工学研究所)と比較しつつ、それぞれの機能について、評価を加えることにしたい。1,2は田原、3は中村が執筆を担当した。
 FMpは元来Mac用のソフトウエアで、Windows版はver3から発売された。私は中村の紹介で、Windows版が発売されて間もなく、今年3月あたりから使い始めた。1997年6月1日に開催された第10回西日本国語国文学データベース研究会(DB-West)におけるシンポジウム「これまでのデータベース、これからのデータベース」の際にも、データベースソフトの現状について討論がなされた。
 私は元々は『桐』(管理工学研究所)を使っていた。桐がなければ夜も日も明けぬほどだった。単なるデータ入力のための表形式の他に、タック、伝票、証明書などのために帳票形式、成績管理のためにリレーショナルな使い方である結合表、索引作りにあたっては一括処理、と一通りの機能を活用してきた。また、桐の充実した文字列関数は、単にデータベース作成ソフトという以上に、文字列加工ソフトとしての威力を持っており、この機能の存在によって、私はそれまで自作でおこなってきたBasicによるプログラミングをやめた経緯がある。
 では、なぜその桐を手放すことにしたのか? 少なくとも、上にあげたことに関して、機能的な限界を感じたからではない。桐という閉じた世界の中では、現在でも十分に使いではある。決定的な理由は、桐がMS-DOSからWindowsへの急激なパソコン界の流れに乗り遅れたからである。Windows95の一ソフトウエアとしてのMS-DOS上で桐を動かすことは、ハード面から言ってもかなりの負担であるし、ソフト面からは、クリップボードが利用できない、ウィンドウの切り替えがしにくい、など多くの制約がある。現在、桐もver6を発売し、見かけ上は流れに対応したが、あくまでも単にプラットフォームを合わせたに過ぎない。私には、マルチメディア性を中心としたWindows95の数々の新しい機能に目を閉ざし、 画面上の他のソフトとの友情関係にも耳を閉ざし、ひたすら桐という窓の中に籠もり続ける自閉症ソフトとしか思えない。
 私のデータベースライフの中に、音声データベースがあるというのも、FMpに乗り換えた大きなきっかけだった。しかし、桐からFMpへの移行には、いばらの道が待っていた。私のソフト習得法は、「退路を断つ」方式である。したがって、乗り換えを決めた日から、新たな桐のファイルを作ることは一切やめた。少々不便だろうが、イライラしようが前のソフトは立ち上げない。かなりのストレスになるが、新しい使い方を発見するためには、この方法がもっとも有効で、近道だと信じるからである。
 FMpの感想について述べると、最初使い始めたころは、なんと使いにくいソフトだろう、行き当たりばったりの操作方法だなあ。という印象だった。素人がプログラムを作りながら、これができたらいいな、こんな機能も要るな、と思いつくたびにでたらめに追加していって、あるとき気がついたらこんなソフトになっていた、という感じである。操作しにくい理由は、Macの作法にしたがっているという点も大きいと思うが、それに加えて、作者(達)の発想が個性的かつ柔軟で、ユーザ(特に日本人のMSDOSユーザ)の想像力を遙かに超えているからではないだろうか。また、これはアメリカ製のソフトだが、ソフトの作り方にも文化的背景が反映されるのかなあと妙に感心したりもした。
 ところが、最近では、それほど不自由を感じなくなっている。逆に、桐の時にはなかった「愛着」が感じられ始めている。WindowsマシンなのにMacユーザになったような、不思議な気分である。最初できなくて不便に感じていたさまざまな点も、発想をかえることで切り抜けることができる。このソフトはユーザに型どおりの使い方を要求していないソフトなのだ。ユーザの数ほど使い方があるのだ。ということが体感できた(Macユーザにとっては自明のことかも知れないが)。
 以下では、上にあげた桐の機能について簡単にFMpと比較し、私なりの評価を加えてみる。タイトルの用語はFMpのものを使い、相当する桐の用語は( )で示す。

2.FMpと桐の機能の比較

 この章では、FMpと桐について、機能ごとに性能および使い勝手を比較してみる。ここでの比較は、FMpについてはver3、桐はver5のスペックによるものである。FMpについては、ver4の改正点は3で述べられるインターネットへの公開機能に絞っているので、ほとんど影響ないと思われる。また、桐についてはver6では、以下で述べる機能のうち、結合、一括処理についてはなくなっており、98年に予定されているver7まで、おあずけの状態になっている。それでは以下、機能ごとに、1.フィールド定義、2.データ入力、3.レイアウト、4.リレーション、5.関数、6.スクリプト、7.印刷、8.検索、9.その他、の9つに分けて比較検討していく。

 2.1 フィールド定義(表定義)
 FMpでは表の列にあたるものを「フィールド」と呼ぶ(プログラム言語では「変数」に、桐では「項目」にあたる)。このフィールドについて、フィールド名、データ形式(テキスト、数字、日付、オブジェクト<画像や音声>)などを定義、あるいは再定義するのがこの画面である。
 フィールド定義に関しては、FMpの方が手軽である。編集を終了することなしに定義画面と行き来しながら、フィールドの削除、変更、追加ができるからである。ただし、桐の定義画面は、編集画面と同じ操作で行複写、行移動、印刷等ができるのに対し、FMpはダイアログボックス形式でこのような操作ができず、フィールド名をすべて手作業によって入力する必要があるので、フィールド数が100を越えるようなデータベースの枠を作成する場合、非常に手間がかかる。
 このフィールド名入力については、桐も基本的には同じであるが、既存のテキストファイルから自動的に読み込んで定義していくようなやり方ができると、データベース作成時の手間がかなり省力化できるのになあ、といつも思っている。

 2.2 データ入力
 桐は、表示画面と訂正画面の2種類を区別しており、表示画面では「矢印キー」で、訂正画面では「シフトキー+矢印キー」で、フィールド、レコード間(表形式で縦横)ともに移動できる。それに対して、FMpでは表示、訂正の区別がなく、フィールド間は「タブキー」で、レコード間は「コントロールキー+矢印キー」で、という使い分けがある。こう書くと割と単純な違いのようだが、乗り換えにあたって一番苦労したのはこの操作の違いであった。指に桐のキー操作が染みついているのである。しかし、この点に関しては、FMpが一般的な操作方法で、桐が特殊なキー操作なのであり、遅かれ早かれFMp的なキー操作も習得しなければならなくなるだろう。
 この問題は、FEP(入力デバイス)の種類ごとに、キー操作が違っているケースとよく似ている。たとえば、一太郎(ジャストシステム)の「ATOK」と桐の「松茸」を同時に使わなければならないような場合である。Mac0s、Windows95時代の今だからこそFEPのキー操作も共通性が高くなっているが、かつては、ファンクションキーを中心にした変換操作が、FEPごとにまったくといっていいほど違っていた。しかし、人間の能力は大したもので、2〜3種類のFEPのキー操作なら習得できてしまうものである。さらに訓練次第では、ローマ字入力とカナ入力の両方(かつて親指シフトなどという特殊なキー操作もあった)を同時に習得できる可能性も持っていると思う。このような違いに比べれば、上に述べたキー操作の違いなど大したことはないと言えるかも知れない。

 2.3 レイアウト
 編集、印刷上のレイアウトについて比較する。桐は、表形式と帳票形式の2種類が峻別されている。これに対してFMpには定型がない。表レイアウト、一行レイアウト、ラベルレイアウトなどといったテンプレートはあるが、白紙の上にどのように配置するかの違いによって、便宜上名付けられているに過ぎない。
 むしろ、表示形式としての「フォーム表示」と「リスト表示」の区別の方が本質的である。「フォーム表示」と「リスト表示」の違いは、前者が1枚の紙に1レコードを表示(印刷)するのに対して、後者がページに入るだけ連続して表示(印刷)するという違いである。フォーム表示が一枚ずつめくっていくイメージなのに対して、リスト表示は画面上で、巻物のように一枚につながってロールアップしていくイメージになる。
 FMpは、強いて言えば、桐でいうところの帳票形式ですべてをまかなっているということになるだろう。このことは、無限のレイアウトが作れるということでもあるが、どんな単純なレイアウトでも、一々自分で作らなければならないということでもある。
 桐の場合は、表形式はエクセルなどの表計算ソフトと同じ固定書式で出来合いだが、帳票形式は自分で作る方式である。FMpを使い始めた当初は、レイアウトを作るのが大変で面倒だったが、慣れるにしたがって、融通のきくFMpのレイアウト方式の方がいいのではないかと思うようになった。特に桐の帳票形式にあたるレイアウトでは、フォントの種類をとっても、ドット単位で位置が設定できる点をとっても、精密さの点でFMpがはるかにまさっている。
 おなじクラリス社から出ているソフトで、クラリスワークスという統合ソフトがあるが、そのデータベース部門ではリスト表示という、表計算ソフト形式あるいは桐の表形式に近い表示機能があるだけに、FMpにこの機能がないのは悔やまれる。

 2.4 リレーション(結合表)
 桐の結合表は、桐の使い方の中でも、一括処理とならんで、最も難しいものである。それに対して、FMpではリレーションがいとも簡単に使える。
 たとえば、学生番号をたよりに1回生、2回生、3回生、4回生時の成績を引っ張ってきて、その期の学生だけの4年間の成績表(かつての学籍簿にあたる)を作る場合を考えてみると分かりやすい。それぞれのファイルが以下のようになっているとする(.fmjはWindows版におけるFMpファイルの識別子)。

94成績.fmjというファイルには、46期生だけでなく、1994年度に2〜4回生だった学生の成績も同時に管理されている。それぞれの年の成績ファイルから、46期生の成績のみをとりだして、まとめて一枚の成績表にしなければならない。そのために手がかりとなるもの(照合フィールドと呼ばれる)は、「学生番号」である。
 これを桐でやろうとすると、結合表を使うわけだが、すこぶる面倒である。結合表定義画面を開き、まず、94,95,96,97年度の成績ファイルを指定すると、次画面で、これらのファイルのすべての項目名が表示される。その中から、結合にあたって照合すべき項目(学生番号)を指定し、必要な項目以外(たとえばその学年では配当されていない科目)を削除する。さらに項目の順序を移動によって整えて保存終了した後、はじめて結合表画面で見ることができる。ただし、この表は実体がないもので、開くたびにそれぞれの成績ファイルから結合をおこなうので表示開始までかなり時間がかかる。
 桐の結合表の難点は、項目数の制限である。ver5で256が上限であるが、この成績表のケースでは、1年度につき60数科目割り当てることができる。これは一見十分な数のようだが、受講することのできる科目は、常に前の学年でとれるものを含んで増えていくので、学年があがるにつれて雪だるま式に増え、瞬く間にこの制限に引っかかってしまうのである。成績表を2枚に分けて管理することは不可能だから、事実上、桐ではお手上げ状態であった。さらにこれを成績表の形にする段階では、帳票形式のレイアウトを作成しなければならないが、帳票形式で表示するには、結合した表を別の独立した表として保存する必要がある。別の独立した表にした段階で、それぞれの成績ファイルとのリレーションが切れてしまう。
 今回、FMpにデータを移行するにあたって一番心配だったのは、この成績管理に関するものであったが、いとも簡単に、そして桐でおこなっていた手順がまったく必要ないことが分かって、感動にうち震えた。はっきり言って、上に述べた成績管理手順は、誰にでもできるものではない、いわばマニアックなものだったが、FMpなら誰にでも簡単にできるのである。
 それでは、FMpによる手順をあげて、桐と比較してみる。FMpでは、まず成績表(学籍簿)にあたるファイル(46期成績.fmj)を作成するが、これには学生番号、名前、学科、生年月日等の個人情報一覧と単位集計用のフィールドのみあればよい。次にこのファイルにリレーションとして、4つの成績ファイル(94〜97成績.fmj)と照合フィールド(学生番号)を指定する。これですべてである。成績表を作るには、レイアウトを作成する時に、各年度の各科目のリレートフィールド(リレーションで関連づけられたフィールド)を直接指定すればよく、46期成績ファイルの中に成績に関わるフィールドが定義されていなくてもよいのである。
 FMpではフィールドを指定することのできるすべての場合で、リレートフィールドを普通のフィールドとまったく同じように指定することができる。この仕組みの種明かしは、FMp内部で、リレーションで関連づけられたファイルを、まとめて一つのファイルとして管理していることである。リレートされるたびに、照合フィールドを基準にして、指定されたファイル内容をくっつけて、大きなファイルにしていくのである。そのため、リレーション指定されたファイルは常に同時に立ち上がった状態になっている。上記成績管理で言えば、計5個のファイルが常に同時に動いていることになる。
 このことによって、46期成績.fmjの成績表レイアウト上で、成績の間違いを見つけた場合、その画面上で訂正することによって、元の成績ファイルのデータも同時に訂正されるという芸当ができることになる。ユーザは46期成績.fmjのデータを修正しているつもりでも、実際に修正されているのは、元の成績ファイルだからである。
 この機能に関しては、桐は足もとにもおよばない。私は、FMpを使ってはじめて、リレーショナルの概念を理解したような気がする。桐はリレーショナルデータベースを標榜しているが、これは看板に偽りありである。ちなみに、ver6では結合表の機能は外されており、名称も「日本語データベースシステム」と変えている。

 2.5 関数
われわれの分野において、関数、とくに文字列操作関数との縁は切っても切れないものである。FMpは、桐とほぼ同等の文字列操作ができる。すなわち、部分文字列置換や、部分文字列を切り出したり、半角から全角へ、あるいはその逆の置換など、基本的な操作はすべてできる。ただ、全置換にあたっての重大な欠点は、直前の関数操作を記憶できないので、ユーザがクリップボードにコピーしておかない限り、同様の操作を繰り返す場合、同じキー操作を何度も繰り返すはめになることである。
 FMpで私がよく使う関数を以下にあげておく。

 2.6 スクリプト(一括処理)
 スクリプトとは、あらかじめ複数の操作命令を記述し、それに名前を付けて保存しておき、必要に応じて適宜実行し、操作の簡略化をはかるものである。FMpではスクリプトはファイル単位で記述、管理されている。これに対して、桐の一括処理はファイルの外からファイル操作自体を操るもので、昔の大型コンピュータで言うところのバッチ処理に近く、ここで比較するのは無理があるかも知れない。
 2.5で述べたようにFMpでは直前操作を記憶しておくためのメモリが、関数に限らず、わずかの例外を除いて一切用意されていない。これを補うためにスクリプトがある(のだと思う)。データベースにおいては、同じデータを幾通りもの方法でソートしたり、検索(選択)したりしなければならないし、しかも、それらの操作を何度も繰り返す必要がある。FMpでは、その時々の状態をスクリプトとして登録しておくことができる。たとえば、学生名簿で2回生だけを取り出し、学生番号順や、成績順に並べ替えて表示するとか、方言などの調査データで、男性のみを取り出して年齢順に表示するといった場合である。
 これらの定型的な操作をスクリプトの形で登録しておき、さらにそれをレイアウト上にボタンの形で配置しておけば、そのボタンをクリックするだけで、数ステップのコマンド操作を自動的におこなってくれる。この機能を知る前と知った後とで、私の中でのFMpの評価は一変したほどである。ただ、FMpのスクリプトに関して残念なのは、桐の一括処理が、ほぼキー操作通りに組んでいけるのに対して、FMpの方は、あらかじめ用意されたスクリプト一覧の中からしか操作が選べないことである(このあたりがFMPの行き当たりばったり的なところである)。

 2.7 印刷
 印刷に関しては、桐に非常に重要で優れた点がある。それは、桐は画面上で見えていない部分もすべて印字してくれるという点である。フィールド幅(桐では項目の表示幅)が狭くて画面上で見かけ上、切れている場合、その幅で印刷したとしても、桐では複数行になって印字される。
 一方、FMpの方は、何が何でも画面で見えている通りにしか印刷してくれない。これは、データベースを作成する過程においては、とても困ることである。印刷のたびに、すべてのデータが画面上で見えているかどうか確認し、一つでも隠れているレコードがあったら枠を広げるという作業は、非生産的だし、数百行、数千行のデータだと作業自体が不可能である。また、たった数レコードのためにすべての枠を広げて印刷するのは紙の無駄でもある。
 FMpに限らず、Mac系のソフト、最近ではWindows95のソフトも、多くこの印刷方法をとっているが、この点は、桐方式の方がよいと思う。FMp等のソフトは、データベースを作成する過程より、完成したデータベースを使う方に重点を置いているのだろう。

 2.8 検索(選択)
 この機能に関しては、桐の方があきらかに優れている。FMpの選択には、「レコードを対象外に」「対象/対象外を入れ替える」「複数レコードを対象外に」「全レコードを対象に」の4つしかなく、したがって、上下に隣り合っていない、この行とその行とあの行の3行を選んで表示、といったことが、一回の操作でできない(信じられないことだが)。桐なら指定行選択で簡単にできるのだが、FMpでは、1行ずつ「対象外に」していき、最後に「対象/対象外を入れ替える」のである。さらに、ここからここまで、少しはなれてそこからあそこまで、といった離れた二つの固まりを選択することは不可能である。桐なら、いったん、1番目の固まりの最初のレコードと、2番目の固まりの最後のレコードを範囲指定して選んでおき、次に、その間の要らない部分を選んで、その補集合をとる、といった絞り込みが自由自在にできる。
 FMpでは、この5つの操作以外は、検索モードでおこなう(桐では、同じ選択の中の条件式による選択を使う)。FMpは、検索モードでも、絞り込みという概念がなく、すべて一発で検索しなければならない。複数条件を論理的に重ねることは可能だが、いったん選んでおいて、それから次の小グループを選ぶ、さらに、いったん絞り込んだものを順に解除していく、といったことができないのは、データベースで検索をおこなう場合、使い勝手が悪い面がある。その他に、FMpでは、桐にある「末尾一致」の検索ができないが、日本語を扱う場合この機能は欲しいところである。

 2.9 その他
 その他に、桐になくてFMpにある特徴をあげる。大きな特徴は、FMpではデータの中に改行コードを入れることができるという点である。この機能は、いままで他のデータベースソフトでは不可能だったのだが、われわれの分野について考えると、文章をまるごとデータベース化する可能性が開けるという点で、まさにコロンブスの卵と言ってよく、電子化テキストを扱うものにとっては朗報である。
 また、私の場合、重宝しているものとして「繰り返しフィールド」という機能があげられる。私の専門は社会言語学である。方言調査データを処理する場合、しばしば併用処理が問題になるのだが、この繰り返しフィールドは、一つのフィールドの中を幾つにも仕切ってデータを入れることができるからである。桐で入力していた時だと、「犬」という質問項目に、「ワンワン」と「ワンコロ」という併用形が出てきた場合、とりあえず、「犬」というフィールドに「ワンワン、ワンコロ」と、読点で区切って一つの項目内に入れておき、全員分入力した後に、最高幾つ併用があったかを確認して、フィールドを「犬」「犬2」「犬3」…というように増やし、さらに「犬」に入っているデータを分離しては「犬2」「犬3」…に移していくという作業をする必要があった。しかし、FMpでは好きなときに好きなだけ繰り返しの数が追加できるから、併用が出てくるたびに定義しなおすことができるし、フィールド名の数が少なくてすむことで、データ管理の際の煩雑さ及びそれにともなうミスも減る。検索時にも、「繰り返しフィールド」全体として検索できるから便利である。

 2.10 まとめ
 以上、FMpと桐の性能比較をおこなったが、以下に機能ごとのまとめを示しておく。現在、出回っている大手データベースソフトには、マイクロソフト社の『アクセス』があるが、私はアクセスに関しては、まったく使用していないので、比較をおこなうことができない。国語国文学研究者の中でアクセスを使用している方に、同様の比較をおこなっていただけるよう期待したい。

3.ネットでのデータベースの公開

 FMpの大きな利点は、比較的簡単にネット上にデータベースを公開できることである。個人の閉じたデータベースだけでなく、構築したデータの共有を考えたデータベースソフトである。WWWブラウザを使って、ネット上での検索・登録・削除・編集などが可能である。

 3.1 公開に必要な一式
 ver3(現在)      … WWWサーバーソフト+CGI+FMp+データ
 ver4(97年12月発売) … FMp+データ
 FMpの持つ機能をインターネット上から最大限に利用するためには、現在はCGI(Common Gateway Interface)と呼ばれるアプリケーションを使用しなければならない。CGIを使えば、目的のソフトを呼び出しその機能を外部から活用することができる。このCGIを作成するためには何がしかのプログラミング言語を操らなければならないが、幸いマッキントッシュをサーバーにするのであれば、システム標準のアップルスクリプトと呼ばれる一種のマクロ言語で作成することができる。
 しかし、平易とはいえ、やはりプログラムを組むのであるから、それなりに敷居は高いと言わざるをえない。FMpで構築したデータベースを公開するにあたって最も苦労するのは、当のFMpの使い方ではなく、それをコントロールするCGIの作成である。マニュアルにもこのあたりのことは書かれておらず、自分で調べていくしかない。ただいくつかの参考書籍が発売されており、複雑なものを望むのでなければ、その中の必要な部分を書き替えることで対応できるであろう。
 この点を改良したのがバージョン4である。つまりWWWサーバーソフトやCGIを使うことなく、データベースをネット上に公開できるのである。驚くべきことにHTMLドキュメントやデータ入力を請け負うフォームすら作成することなく、ブラウザにFMpのファイルを定型のフォームで表示する。もちろん基本的な機能である表示・編集・追加・削除・検索・ソートが可能である。公開するデータベースごとに細かなセキュリティも設定することができる。サーバーマシンとFMpさえあれば、後はすべて面倒を見てくれるのであるから(ネットに関する難解な知識は不要)、今後自作のデータベースをネット上に公開し、利用されることを考えるのであれば、まずこのソフトが第一候補となろう。

 3.2 参考となるホームページ及び資料
 日本文学データベース研究会(NDK)のホームページ(データ公開)
 http://ndk.let.osaka-u.ac.jp/            … 次ページに検索画面を示す

 田中求之氏(福井県立大学)のホームページ(スクリプティング)
 http://mtlab.ecn.fpu.ac.jp/

 拙稿「インターネット上の源氏物語データベースに関する覚書」
 (「日本語研究センター報告」Vol.4、1997年3月)

【付記】
 この論文は、第11回西日本国語国文学データベース研究会<11thDB-West>(1997.12.7、於大阪樟蔭女子大学)においておこなった報告「ファイルメーカーProでデータベースを作る」(田原、中村)に加筆したものである。