発表「データと理論」

先日、「データと論文の間―フィールドサイエンスにおける論証とは」というワークショップで話をしました。イベントの詳細は<こちら>です。

話は、「データと理論:データあっての理論か、理論あってのデータか」というタイトルで、我々が扱う「データ」について考えてみたものです。特にアッと驚くようなことは何も言っていませんが、日々の研究の中ではついつい忘れがちであるポイントについて注意を促すような趣旨のものです。

【要旨】

(発表スライドは<こちら>)

「データ」とは、理論構築や仮説検証の基盤であり、客観的分析・論証を軸とする科学的研究の基礎をなすものと言えるだろう。厳密にはより慎重な性格付けが必要であるとしても、「データは正しい」、「データは嘘をつかない」といった言い回しに見えるように、一般的にはデータとは物理世界にある「動かしがたい」事実で理論的枠組み・記述の枠組みから独立して存在するものと考えられている。フィールド調査の重要な意義の一つにも、活動の現場での直接観察により正確で客観的なデータが収集できる点が挙げられたりする。ここでも本来の「データ」はあるがままの客観事実であるという捉え方がされている。

本発表では、研究において我々が日常的に前提としている「データ=客観的事実」という見方について、言語研究、特に形式のシステムとしての文法に関する研究において言語事実をどのようにデータとして扱うかを吟味しつつ、再考察した。

文法体系の研究では、言語表現の組み立てや使い方に見られる規則性を手掛かりとして、その規則性を生み出している構造的体系、規則体系及び生成メカニズムを明らかにすることを目的としている。こうした研究を支えるデータとしては、使われた語の形や語の使われ方(どこに現れ、どんな語と組み合わされるか、どのような語と類似した振る舞いをするか、など)などの直接観察による事実のみならず、話者による文の適格性の判断や、言語要素の配置を操作した実験の結果なども用いられる。こうしたデータは言語研究においては研究の基礎をなす基盤的なものであるが、研究の客観性を確保するという観点からは悩ましい性質を持っている。

まず、言語表現の形や使われ方については、同じ言語コミュニティーの中であっても、個人差や文脈上のばらつきが見られる。また、言語表現は常に変化しているために、それが世代間や用法間の差異となって表れることが非常に多い。それらの現象的なばらつきの全てが言語の体系的側面を同じように関係しているとは考えにくく、それら全てを考察に入れては、言語の規則性を明らかにすることはほぼ不可能になってしまう。どの形式・用法を「データ」として取り上げるのかを何らかの形で選別する、つまり「意味のある事実」と「意味のない事実」を区別する必要がある。言い換えれば、言語研究においては事実が選別され、全ての事実がデータとして扱われるわけではないのである。さらに、その選別の基準は客観世界に見出すことはできず、よって立つ理論的枠組みによって与えられるしかない。

こうした、理論的枠組みに沿った事実の選別は、文の適格性の判断など複雑で主観的な判断に関する観察事実についてはいっそう顕著な問題として浮上する。文の適格性の判断の解釈やそもそもの有効性については言語学者の間でも大きく揺れるが、その適否を決着付けるのは結局理論的枠組みしかなく、その枠組みを共有しない研究者間での議論の解決ができない。それは、これまで長く繰り返されてきた議論の結果を見ても明らかである。

このように見てくると、「データ」は客観事実そのものではなく、理論的な文脈・要請の中で選び取られた事実であることがわかる。そして、直接観察による「データ」に基づく研究も、望むか望まざるかにかかわらず、前理論的研究や理論的に中立な研究ではありえない。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)