TOP>活動記録>講演会>第428回 一覧 前回 戻る  


第428回 邪馬台国の会(2025.3.25 開催)
邪馬台国問題解決への道


 

1.邪馬台国問題解決への道

ある説が正しい、とはどういうことか。 数理歴史学の基礎論。

■データサイエンス
ものごとに成功したり、上達したりする近道であり、かつ正道と言える方法がある。それはすでに成功している人、上達している人のまねから始めることである。「学(まな)ぶ」ということばは、「まねぶ(まねをする)」から来ている。
邪馬台国問題は「証明」を必要とする問題であるとすれば、偽物(にせもの)や詐欺師にだまされて、同じような失敗をくりかえしている考古学エスタブリッシュメント(既得権益派)についていってはいけない。
「証明」の分野において、たえざる進展とめざましい成果を上げているデータサイエンス、数理科学、数学などにこそ、ついて行くべきである。

最近のデータサイエンスの進歩は目をみはるものがある。
とくに、世間の耳目を集めたのは、碁、将棋、チェス、オセロ、五目ならべなどのゲームにおいては、いまや、いかなる名人、上手といえども、コンピュータに勝てなくなってしまったことである。
たとえば、碁では、2017年5月に、グーグル傘下のディープマインド社の「アルファ碁」が、世界ランキング第1位の中国の柯潔氏を、3勝無敗で圧倒している。
将棋でも、同じ年の同じ月に、山本一成氏ら開発の「ポナンザ」が、佐藤天彦(あまひこ)名人に、2連勝し、電王戦を制している。
チェスでは、すでに、1997年に、IBMのスーパーコンピュータ「ディープブルー」が、ロシアのチェス世界チャンピオン、ガルリ・カスパロフを破っている。

これらのゲームでは、一手一手について、最終「勝率(勝つ確率)」を、コンピュータが示すことができる。さらに、コンピュータ同士を戦わせて、より勝率の高いソフトウェアを開発することができる。「勝率」にみちびかれ、文字どおり、機械的に打つ手が定められて行くのである。
確率計算の結果のほうが、名人の手を読む力を上まわっているのである。

京都大学大学院文学研究科准教授の大塚淳(おおつかじゅん)氏の手になる『統計を哲学する』(名古屋大学出版会、2020年刊)という本がある。
この本の中で、大塚氏は記す。
「この本は何を目指しているのか。その目論見(もくろみ)を一言で表すとしたら、『データサイェンティストのための哲学入門、かつ哲学者のためのデータサイエンス入門』である。ここで『データサイエンス』とは、機械学習(安本注。「機械学習」は、「機械で学習する」という意味でではない。「計算機自体が、データから学習すること」を意味する)研究のような特定の学問分野を指すのではなく、デー夕に基づいて推論や判断を行う科学的/実践的活動全般を意図している。」

現代において統計学は、与えられたデータから科学的な結論を導き出す装置として、特権的な役割を担っている。良かれ悪しかれ、『科学的に証明された』ということは、『適切な統計的処理によって結論にお墨付きが与えられた』ということとほとんど同義なこととして扱われている。しかしなぜ、統計学はこのような特権的な機能を果たしうる(あるいは少なくとも、果たすと期待されている)のだろうか
そこにはもちろん精密な数学的議論が関わっているのであるが、しかしなぜそもそもそうした数学的枠組みが科学的知識を正当化するのか、ということはすぐれて哲学的な問題であるし、また種々の統計的手法は、陰に陽にこうした哲学的直観をその土台に持っているのである。」
例えば、ベイズ統計や検定理論などといった、各統計的手法の背後にある哲学的直観を押さえておくことは、それぞれの特性を把握し、それらを『腑に落とす』ための一助になるだろう。」

ここで注意注目すべき事は、AI[Artificial Intelligence(人工知能)]将棋などにしても、ベイズ統計にしても、統計学的検定理論にしても、「確率」を求めることが、基礎をなしていることである。AI将棋などは「勝率」という形で「確率」を求める。ベイズ統計学では、「邪馬台国が福岡県にあった確率」「奈良県にあった確率」などの形で確率を求める。統計学的検定論では、種々の仮説のうち、一定の確率(ふつうは、1%、または、5%)以下の確率でしか成立しない仮説は捨てる(棄却)する約束をもうけることによって話を進める。そうしないと、「どんな小さな確率でも成立しないとは言えない」というような議論を強固に主張する人が出てきて、議論に決着がつかなくなるからである。つまり、仮設の取捨を客観的に行う装置として、「確率」を求める。鍵は「確率」にある。このことは、重要である。(哲学の問題ではなく、数学的、客観的基準を定める問題ではないか?)

 

■統計的方法の論理
統計学、あるいは、確率論による判断の論理は、私たちの日常の、常識的な論理とは、すこし異なるところがある。このくいちがいが、統計学あるいは確率論による判断に対して、人文科学の分野では、しばしば見当はずれの議論をひきおこしているようである。
そこで、はじめに、簡単な例によって、統計学、あるいは、確率論による判断の論理について、いますこしくわしく説明しておこう。

いま、ある人が、「私は、十円玉を投げて、十回つづけで表をだしてみせる」といって、十円玉を投げ、ほんとうに、十回つづけて表をだしてみせたとする。
このばあい、私たちの日常の常識的な論理では、まず、つぎのような「仮説」をたてるであろう。いま、この仮説を、H1とよぶことにする。

仮説H1 この十円玉には、なにか、インチキなしかけがある

そして、つぎに、この「仮説」を「検証」するために、その十円玉をしらべたり、その人の投げる手順をしらべたりする。

あるいは、つぎのような「仮説H2」をたてる人もいるかもしれない。

仮説H2 これは、「偶然」によって、十回つづけて表がでたのだと考える

そして、それ以上の探究は、放棄してしまう。このばあいに、なにを「偶然」と考えるかを、本人の「主観」にまかせると、「偶然によって、十回つづけて表がでるはずがないと私は考える」と主張する人もあらわれるであろうし、議論の決着が、つかなくなってしまう。

統計学、あるいは、確率論による判断の論理では、このようなばあい、一般に、まず、つぎのような形の「仮説」をたてるのである。この仮説(帰無仮説)をH0としよう。

仮説H0 この十円玉の投げ方には、インチキはないと考える。

そして、つぎに、この仮説にもとづいて、論理を「演繹」するのである。すなわち、この「仮説」のもとでは、十円玉が十回つづけて表を出すことは、どれくらいの確率でおきるかを計算する。

「仮説H0」にもとづけば、この十円玉には、とくべつなインチキなしかけはないと考えるのであるから、表がでる可能性も、裏がでる可能性も、一応、ほぼ同じであると考えてよいであろう。すなわち、この十円玉の表がでる確率は、一応、二つに一つという意味で、1/2としてよいであろう。すると、十回つづけて表がでる確率は、

(1/2)↑10=1/1024

となる。

この1/1024という確率は、ふっうでは、まず、ちょっとおきないぐらいの小さな確率である。そのように小さな確率でしかおきないことが、偶然によっておきるのは、不自然である。そして、現代の統計学では、このようにしてえられた確率が、「5/100」または「1/100」よりも小さければ、もとの「仮説H0」をすてるという「約束」をもうけている。1/1024は、5/100よりも小さいし、また、1/100よりも小さい。したがって、もとの「仮説H0」は、すてさることになる。

すなわち、結論的には、
この十円玉の投げ方には、インチキなしかけがある。」
と判断することになる。

常識的な「仮説H1」のように、はじめに、「この十円玉の投げ方には、インチキなしかけがある」としてしまうと、それ以上論理を演繹することができなくなってしまう。そして、その仮説のもとでは、十円玉をしらべるとか、十円玉を投げる手順をしらべるとかする以外に、手がなくなってしまう。

「仮説H0」すなわち「この十円玉の投げ方には、インチギなしかけはない」のように、結論的には否定されることを予想してもうけられる仮説を、「帰無仮説[null hypothesis(ナル ハイポシシス)」という。

そして、この仮説が否定されたばあいには、私たちは、「この十円玉の投げ方には、インチキなしかけがある」と、「積極的に」主張できることになる。そして、私たちは、この結論が、どのていどの確からしさで成りたつかも、数字で知ることができる。すなわち、この結論が、絶対に正しいとは、いえないけれども、この結論が誤りであることは、百回に五回(5/100)、または、百回に一回(1/100)以下の割合でしか起きないという保証があるのである。このようにして、仮説の取捨の基準をさだめ、議論の客観化をはかるのである。確率は、カケ算できいてくるので、十円玉の問題のようなばあい、十回も試行すれば、十分、仮説の取拾の客観的判断ができる。だれが計算しても、同じ結果がえられる。つまり、「再現性」のある結果がえられる。

データサイエンスの骨格をなす統計学は、イギリスの統計学者、フィッシャー(Fisher,R.A.1890~1962)によって、1920年代に、いわゆる「推計学(推測統計学)」が提唱され、大きな変革がもたらされた。それまでの統計学は、観察・記述の学であったものが、確率論にもとづいて、推測の方法を与える学となった。実際の問題を解決する学となった。

いまから60年ほど前、フィッシャーらの推計学をわが国に紹介した増山元三郎氏(東京理科大学教授など)は、「検定のない調査は随筆に等しい」と述べている。
発言をするにあたっては、「どの程度確からしいのか」確率計算に基づく保証をつけるべきである。というのである。

 

■ベイズの統計学
ベイズの統計学の意味する内容をイメージとしてつかんでいただく。
428-01
☆『数学セミナー』 1955年12月号
評者の細井勉氏は、東京理科大学教授の数学者。

計量言語学の手法とその成果
言語の科学
日本語の起源をたずねる

安本美典萋著
A5版、223ページ、1995年4月発行、3708円(税込)
朝倉書店

本書の著者はたいへん幅広い分野で活躍しておられ、そのご専門は分野名で特定し難いのですが、強いて言うと、応用数理学でありましょうか。近頃は、邪馬台国の問題など、日本の歴史に関係した分野での活躍が目立ちますが、日本語、とくにその起源の問題は、氏が以前から研究し、多数の著作を発表してこられた、おそらくメインの分野の一つではないかと思います。
最初に著者を応用数理学者と紹介したのは、ふつうは数理となじまないと思われている分野での研究に際して、いつも、数理的手法を活用しておられるからです。日本語の問題にしても、歴史の問題にしても、数理的に分析するとこうなるのだと、きわめて明快な結論を提示してきておられます。

さて、『言語の科学』と題する本書は、科学的手法での言語研究を目指した計量言語学を紹介したものです。この学問は、外国ではもうかなり確定したものなのですが、残念ながら、日本ではあまり知られていないようです。それで、それを紹介したい、ということです。副題は「日本語の起源をたずねる」ですが、「行動計量学シリーズ」の広告の中では、「比較言語学の新しい方法」となっています。実際、計量的な手法による、言語比較のたくさんの成果が具体例として示されています。その中には日本語も入っています。そして、その最後に、それらの成果を眺めて、日本語の起源についてどのように考えられるかを、比較的に簡単に、述べてあります。

つまり、計量言語学の中の言語比較の分野の紹介書です。たとえば、日本語と朝鮮語は親戚と言えるかどうか、というような問題がありますが、言語間の「近さ・遠さ」を議論する分野の紹介です。そのような言語比較では、数理的な裏づけをしない議論が多いのですが、比較のための計量化の方法をいろいろと、そして綿密に、解説しています。
中心は、言語比較の研究に使われてきた、数理的な諸手法の紹介と具体的な言語の比較にあります。いろいろな言語を比較した諸氏の研究成果が紹介されています。統計学の紹介が丁寧なのですが、それは、結論を理解してもらうため、また結論に信頼感を持ってもらうため、だと読み取れます。
主題の言語比較は興味深いものです。日本語と他の言語と比較するために基礎語彙表を準備した努力には頭が下がります。そういうデータや図表などを眺めているだけでも、いろいろなことが示唆されます。
じつは、評者は、以前から、安本氏の著書は、この本に限らず、統計学の入門書、啓蒙書としても素晴らしいものだという、著者が意図していないと思われる面からの評価もしています。そのような本として学生に推薦したりもしています。もちろん、目指している目的から、統計学としては扱う範囲が偏ってはいます。でも、具体的な応用例が、ふつうの統計学の入門書の場合のように付け足し的というのではなくて、本格的なので、その意味でも面白みがあるのです。
ところで、評者自身、言語の問題に関心があり、二、三十年前には計量的な研究をしたりもしていていました。そういうことで、いつも、安本氏の研究に注目していて、新著が出されるのを楽しみにしていたものです。今度の本は、こういうことが分かったぞ、という意気込みからのものではないようです。先輩として若い人たちにこの分野の面白さを伝え、この分野に入ることを誘いたい、という気持ちが強く伝わってきました。
言語に関心のある方々にも、統計的手法に関心のある方々にも、一読をすすめたい本です。               細井勉(ほそいつとむ)[東京理科大学、数学]

 

「統計的再現性」について
小説家で、工学博士でもある森博嗣(もりひろし)氏は、その著『科学的とはどういう意味か』(幻冬舎新書、幻冬舎、2011年)という本のなかで、次のように述べている。
「では、科学と非科学の境界はどこにあるのだろう?
実は、ここが科学の一番大事な部分、まさにキモといえるところなのである。
答をごく簡単にいえば、科学とは『誰にでも再現ができるもの』である。また、この誰にでも再現できるというステップを踏むシステムこそが『科学的』という意味だ。
ある現象が観察されたとしよう。最初にそれを観察した人間が、それをみんなに報告する。そして、ほかの人たちにもその現象を観察してもらうのである。その結果、同じ現象をみんなが確かめられたとき、はじめてその現象が科学的に『確からしいもの』だと見なされる。どんなに偉い科学者であっても、一人で主張しているうちは『正しい』わけではない。逆に、名もない素人が見つけたものでも、それを他者が認めれば科学的に注目され、もっと多数が確認すれば、科学的に正しいものとなる。

このように、科学というのは民主主義に類似した仕組みで成り立っている。この成り立ちだけを広義に『科学』と呼んでも良いくらいだ。なにも、数学や物理などのいわゆる理系の対象には限らない。たとえば、人間科学、社会科学といった分野も現にある。
そこでは、人間や社会を対象として、『他者による再現性』を基に、科学的な考察がなされているのである。」

「まず。科学というのは『方法』である。そして、その方法とは、『他者によって再現 できる』ことを条件として、組み上げていくシステムのことだ。他者に再現してもらう ためには、数を用いた精確なコミュニケーションが重要となる。また、再現の一つの方 法として実験がある。」
また、生物学者の池田清彦氏は、その著『科学とオカルト』(講談社学術文庫、講談社、2007年)の中で、次のように述べている。
「十九世紀までは、現在のような制度化された科学はなかった。そればかりか、今日、科学の重要な特徴と考えられている客観性や再現可能性を有した学問それ自体もなかっ たのである。」
そして、池田氏は、「『再現可能性』という公準」という見出しの節をもうけて、例をあげて、「再現可能性」「同じやり方に従って行なえば、だれがやっても同じ結果がでること」こそが、「科学」においては、重要であることをのべている
化学や物理学や医学・薬学など、実験可能な分野における「実験」にあたるものが、天文学における「観測」や。社会科学や人文(じんぶん)科学における「統計的調査」である。


・実測値自体は変わっても、結論はかわらない。

松原望氏(東京大学名誉教授)は、わが国において、ベイズ統計学の第一人者といってよい方である。私は、松原教授の指導をうけながら、松原教授とともに、邪馬台国問題をベイズ統計学によって解くことを考えた。
松原教授は、『文藝春秋』にのせられた文章の中で、のべておられる。
統計学者が、『鉄の鏃』の各県別出土データを見ると、もう邪馬台国についての結論は出ています。畿内説を信じる人にとっては、『奈良県からも鉄の鏃が四個出ているじゃないか』と言いたい気持ちはわかります。しかし、そういう考え方は、科学的かつ客観的にデータを分析する方法ではありません。私たちは、確率的な考え方で日常生活をしています。
たとえば、雨が降る確率が『0.05未満』なのに、長靴を履き、雨合羽を持って外出する人はいません」

「各県ごとに、弥生時代後期の遺跡から出土する『鏡』『鉄の鏃』『勾玉』『絹』の数を調べて、その出土する割合をかけあわせれば、県ごとに、邪馬台国が存在した可能性の確率を求めることが可能になります。その意味では、邪馬台国問題は、ベイズ統計学向きの問題なのです」(「邪馬台国を統計学で突き止めた」『文藝春秋』2013年9月号)

私も、松原望教授との共同研究の成果をまとめ、『データサイエンスが解く邪馬台国--北部九州説はゆるがない--』(朝日新書、朝日新聞出版、2021年刊)などの形で本にした。

 

■ベイズの定理の証明
統計学者が、一目見てわかることが、考古学関係の方には、どれほど説明しても理解していただけないことが多い。

2024年3月31日の「邪馬台国の会」の講演のさいに配布した資料から、下図の表(福岡県・佐賀県・長崎県・奈良県にしぼったばあいの最終確率の求め方)がある

428-02


これを簡単モデルに置きかえてみる。鏡の出土において、福岡県は、奈良県の10倍。鉄鏃の出土において、福岡県は奈良県の100倍とし、他の出土物は入れ込まないとすると、下の表のようになる。
428-03

関連遺物が多いほど、それが邪馬台国の地である可能性(確率)が大きいとすれば、福岡県に邪馬台国が存在した可能性は10×100=1000倍となる。奈良県にあった可能性は1/10×1/100=1/1000となる。

 

☆ベイズの統計学により確率を求める(A)(B)(C)(D)の四とおりの方法

一般的に、数学の幾何で使うピタゴラスの定理は知っているが、「ピタゴラスの定理が正しいことを証明せよ」と言われと、ちょっと考えてしまうはず。そして、ピタゴラスの定理は証明の仕方が幾通りもある。

同じように、ベイズの定理は簡単に計算できる。そしてその証明方法は幾通りもある。その例を示してみたい。

・与えられたデータ(出土数)をもとに確立を計算する。
簡単な例として、福岡県から鏡2個と勾玉2個が出土、奈良県から鏡1個と勾玉1個が出土したと考える。

(A)行(横)の値を順次掛けて行き、県ごとの値を求め、その値を、県ごとの値の合計値で割る方法。
・アルゴリズム(計算方法)は、もっとも単純、かつ機械的でわかりやすいが、確立の意味がややつかみにくい。

428-04

 

(B)ベイズの公式による方法。

ベイズの定理は邪馬台国の会第416回講演を参照

下記のベイズの定理の公式がある。
428-05

 

 

 

 

 


この式の分子と分母をP(H1)/P(D|H1)で割った式を使う。

すると、下の式になり、ベイズの公式により求められる。

(A)の方法と(B)の方法とは、下の左のような形で、数式上も一致する。
428-06



(C)「ばあいの数」を数える方法。
上の方にある表(福岡県・佐賀県・長崎県・奈良県にしぼったばあいの最終確率の求め方)において福岡県か奈良県かのいずれからか、鏡1面、勾玉1個をとりだした。「鏡も勾玉も同じ県からとりだしたこと」はわかっている。
いま、上の表の、福岡県の2面の鏡を。a11、a12、2個の勾玉を、b11、b12とする。
奈良県の1面の鏡をa21、1個の勾玉をb21とする。
9とおりくみあわせ(3×3)。
福岡県だけのくみあわせ4とおり。
奈良県だけの組み合わせ1とおり。
下の式のようになる。

428-07

 

(D)図による方法
上の方の表(福岡県・佐賀県・長崎県・奈良県にしぼったばあいの最終確率の求め方)の場合、下図のようになる。

428-08

このように、(A)(B)(C)(D)の4つの方法を示した。


・県の数と、遺物の種類数とを、ふやしたばあい
いま、「福岡県」と「佐賀県」と「奈良県」との3つの件について、「鏡」と「勾玉」と「鉄鏃」との3つの遺物の出土数を調べたところ、下の表のようであったとする。

428-09

(A)行(横)の値を順次かけて行き、県ごとの値を求め、その値を県ごとの値の合計値で割る方法。

428-10


(B)ベイズの公式による方法。
邪馬台国が、福岡県にあった確率を求める場合は、福岡県と他の県の出土数の比 a2/a1、a3/a1、b2/b1、b3/b1、c2/c1、c3/c1などを求めて、ベイズの公式により、つぎのようになる。

428-11


他の県の値も同様にして求められる。


(C)の「ばあいの数」を数える方法や。(D)の図による方法などについても、鏡と勾玉だけの場合と同じようにして考えることができる。

以上のように見てくると、(A)の、行(横)の数値を掛け合わせた数値は、「鏡」「勾玉」「鉄鏃」の3つがともに出てくる場合の数を数えるものであり、「鏡」と「勾玉」と「鉄鏃」がともに出土するという条件のもと(条件付き確率)で、「福岡県」なら「福岡県」が占める空間(面積)の大きさを示していることになる。

 

  TOP>活動記録>講演会>第428回 一覧 上へ 前回 戻る