カタルーニャ語の響きをスペルから考える


前回の記事で、カタルーニャ語の響きがスペイン語に比べて「軽やかに」聞こえる理由を、音節の数に着目して考えてみた。

カタルーニャ語の響きの軽やかさ

今回は、あらためて「軽やか」と感じる要因について仮説を立てた上で

  • 文法・音韻の規則をもとに
  • 計算機を用いて

検証してみたい。

仮説1: /d/ の音が少なく、/t/ の音が多い

バルセロナ地下鉄3号線に乗ると、Trinitat Nova という行き先を目にするはずだ。Trinitat Nova はスペイン語に訳すと Trinidad Nueva となる。1つ目の単語をよく見比べてみると、t が d で置き換わっていることに気づくだろう。

Trinidad の他にも、スペイン語には -dad という語尾の名詞が数多く存在するのだが、カタルーニャ語ではこれらの語尾が -tat になっているケースが多い。

英語スペイン語カタルーニャ語
communitycomunidadcomunitat
universityuniversidaduniversitat
cityciudadciutat

また「すべて」を表すスペイン語の Todo はカタルーニャ語で Tot というそうだ。

d の音は、日本語的に言えば「濁音」だが、t の音は、濁りのない音だ。カタルーニャ語の「軽やかさ」に貢献している要因のひとつは、d の代わりに t で綴られる名詞の存在にあるのではないか。

さて、ここで文字と発音の関係を明確にしておこう。文字と発音は、1対1に対応しているわけではない。英語を例にすれば、cap の a は /æ/ だが、father の a は /ɑ́ː/ だ。逆も然りで、同じ発音を持つ文字が2つ以上ある場合もある。今回は文字のデータを利用して言語のについて考えていくため、両者の対応関係には注意が必要だ。

話を戻そう。スペイン語・カタルーニャ語の d の文字には、発音記号で /d/ と表される音のみが対応する。同様に t の文字には /t/ の音だけが対応する。/d/ の音は専門用語で「有声歯茎破裂音」と呼ばれており、発声する際に声帯が振動する音だ。それに対して /t/ の音は「無声歯茎破裂音」で、発声する際に声帯が振動しないそうだ。声帯が振動しない方が「軽やか」な音に聞こえるといえるだろう。

整理すると、

カタルーニャ語とスペイン語のどちらにおいても

- d の文字 ⇄ /d/ の発音
- t の文字 ⇄ /t/ の発音

が成り立つ

  ↓

ある文章中における d と t の出現回数
= その文章を読み上げた時の /d/ と /t/ の出現回数
(等号が成立する)

よって、下記のような仮説を立てることができそうだ。

カタルーニャ語では、スペイン語に比べて d の文字が少なく t の文字が多い

⇄ カタルーニャ語では、スペイン語に比べて /d/ の発音が少なく /t/ の発音が多い

仮説2.1: 子音の語尾が多い

前回の記事で、カタルーニャ語の文章はスペイン語の文章よりも音節の数が少ないという傾向がつかめた。しかし「音節の数が少ないほど、軽やかな印象が増すように感じる」というのは、本当にそうだろうか。

1音節を発話するのにかかる時間が両言語で同じ1だと仮定すれば「音節の数が少ないほど、短い時間で話し終わる」ことが導かれる。しかしそれは「軽やか」な印象につながるか? なぜなら「会話を聞いていて軽やかと感じる」とき、会話は無限に続いているものと仮定できるので、ある内容の話題が短い時間で話し終わったかどうかは、この感覚に影響しないはずだ。

あらためて語彙の特徴を見てみよう。tot / todo, camp / campo のように、スペイン語の単語には存在する語尾の母音が、カタルーニャ語には存在しないことがある。

そこで「カタルーニャ語は、スペイン語に比べて語尾が子音の単語が多い」という仮説を立て、語尾が子音となっている単語の割合を数えてみることにしたい。前回の記事で取り上げたバルサの応援歌の冒頭を振り返ってみよう。語尾が子音の単語を太字で表すと、下記のようになる。

  • カタルーニャ語
    • tot el camp, és un clam, som la gent blaugrana
  • スペイン語
    • todo el campo, es un clamor, somos la gente azulgrana

仮説2.2: 開音節が多い

さらに、音韻論の規則を取り入れて、別の指標を設定してみたい。音節のうち、末尾が母音の音節は「閉音節」というそうだ。それに対して、末尾が子音の音節は「開音節」というらしい。

単語中の音節の区切りをハイフンで表し、開音節を太字にすると、下記のようになる。

  • カタルーニャ語
    • tot el camp, és un clam, som la gent blau-gra-na
  • スペイン語
    • to-do el cam-po, es un cla-mor, so-mos la gen-te a-zul-gra-na

カタルーニャ語はスペイン語に比べて、開音節の割合が高い」可能性は考えられないだろうか。

仮説2.3: リエゾンが多い

語尾が子音だと、次の単語と音がつながる「リエゾン2」が起こりやすい、ということは前回の記事でも触れた。このことから「カタルーニャ語は、スペイン語に比べて、語尾が子音の単語の割合が少ない」という仮説が考えられそうだ。

母音や音節、単語の切れ目のリエゾンが影響を与えているのは確かだが、音節のうち開音節が占める割合と、語尾のうち子音語尾が占める割合、どちらの指標が「軽やかさ」の要因としてより適しているのかを判断するのは、現時点では難しい。そこで、どちらも計算してみた上で、結果を考察してみたい。

準備:データセット

ここまでで紹介した仮説を検証するには、幾つかの準備が必要だ。

まず、カタルーニャ語とスペイン語で同一の内容を記した文章を用意しなくてはならない。さらに、偏りを減らすためには、含まれている文字数がなるべく多い方がよい。

この条件を満たす文章にはどんなものがあるだろう。法律や法的文書は、言語が違えど内容は絶対に同じはずである。言語間で異なる内容が書かれていたら、とんでもない事態になりかねないからだ。また、国際条約や貿易協定といった外交文書も、かなり緻密に作られている正文と聞いたことがある。

そこで今回は、データセットとして、ひとまず

  1. カタルーニャ自治憲章
  2. スペイン憲法
  3. イベリア航空 契約条件

を利用することにした。

カタルーニャ自治憲章は1975年のスペインの民主化に伴って制定されたもので、カタルーニャ語の原文のほかにスペイン語などの完訳が公開されている。スペイン憲法はその名の通り国の憲法で、原文はスペイン語で書かれているが、のちにカタルーニャ語訳も制作されている。また、イベリア航空の契約条件には、航空券の払い戻しだとか欠航時の対応が書かれており、日本語版もある。

また、テキストファイルを読み込んで、

  • アルファベットの出現回数を数える
  • テキストファイルから音節を切り分けて、リエゾンを数える

ようなプログラムを Python で書いた。

https://github.com/HarukiKinoshita/catalan_analysis

音節に区切るには、Pyphen というハイフネーションライブラリを利用している。

結果1

まず、結果を見てみよう。

カタルーニャ自治憲章 スペイン憲法 イベリア航空 契約条件

スペイン語では、dとtの割合の差がいずれも±1%以内に収まっているのに対して、カタルーニャ語ではその差が大きく、3つのテキストすべてにおいてtの割合がdの割合を上回っている

結果2.0

まず、単純に母音の数だけをカウントして、割合を算出してみた。

母音の数

いずれの場合も、カタルーニャ語の方が、母音の割合が小さいのが見て取れる。

結果2.1

次に、語尾が子音となっている単語の割合を見てみよう。

語尾が子音となっている単語の割合

こちらも予想と一致している。カタルーニャ語の方がスペイン語に比べて、語尾が子音である単語の割合が高い。

結果2.2

次は、末尾が子音となっている音節(開音節) の割合を調べてみた。

末尾が子音となっている音節(開音節)の割合

イベリア航空の契約条件では、両者の差が10%程度あるものの、最も文字数の多いカタルーニャ自治憲章では、その差は1%以内とわずかである。有意水準5%として2言語の割合の差を検定したが、帰無仮説は棄却されなかった。

したがって、開音節の割合は、カタルーニャ語とスペイン語を特徴づける要素とは断定できない

結果2.3

リエゾンが含まれる割合はどうだろうか。

リエゾンが含まれる割合

やはり、リエゾンが起こる単語のペアはカタルーニャ語に多いようだ。

結論

/d//t/ の入れ替わりに伴う音への影響は、十分に検証できたといえる。一方で音節については、音節数、開音節の割合、子音語尾の割合が、どのように関係しているのか、どの指標がもっとも適切か、精査する必要である。またリエゾンについては、カタルーニャ語におけるリエゾンがどんなものかを明らかにした上で、今後より深く調査してみたい。「軽やかさ」の定義も、リエゾンを踏まえて変更する必要があるかもしれないし、あるいは「滑らかさ」のような別な観点で捉えた方が良いのかもしれない。

参考資料

Footnotes

  1. 音韻論において、一定の時間的長さをもった音の分節単位を「モーラ」と呼び、本来はこちらで考えるべきなのだろう。

  2. リエゾンは厳密にはフランス語における現象を指すから、カタルーニャ語においてそのまま適用できるのかは不確かで、検証が必要である。