属性選好分析

属性差分布

オンライン・デートでは、属性選好、自己呈示、相互作用において大きな男女差がある. ユーザーは通常、相手の年齢や身長に対してある種の嗜好を持っている。 男女とも、相手候補にメッセージを送る際、年齢差は年齢(受信者)-年齢(送信者)、身長差は身長(受信者)-身長(送信者)として計算されます。 図1と図2は、それぞれ年齢差と身長差の分布を示している。 また、比較として、女性(男性)ユーザが男性(女性)ユーザにランダムにメッセージを送信すると仮定して、ランダム化した結果も示す。

Figure 1

Age difference distribution.これは年齢差の分布である。 FMは女性ユーザが男性ユーザにメッセージを送ること、MFは男性ユーザが女性ユーザにメッセージを送ることを表している。 実線は対応するデータポイントの局所重み付け多項式回帰フィッティングを表し、灰色の区間は95%信頼区間を表す

図2

身長差分布. FMは女性ユーザが男性ユーザにメッセージを送ること、MFは男性ユーザが女性ユーザにメッセージを送ることを表す。 実線は対応するデータポイントの局所重み付け多項式回帰フィッティングを表し、灰色の区間は95%信頼区間

ほとんどの時代と場所で、女性は通常年上の男性と結婚します。 図1を見ると、現代中国社会では、平均して、男性は2歳年下の女性を好み、女性は2歳年上の男性を好むことがわかる。 しかし、女性が受け入れる年齢差の幅は男性よりも小さく、女性が受け入れる最低年齢は11歳年下、最高年齢は23歳年上の男性であり、男性が受け入れる最低年齢は25歳年下の女性、最高年齢は28歳年上の女性である。 年齢差の分布だけを見ると、これまでの様々な文化や宗教の知見と同様に、女性がメッセージを送りたい年齢の幅は、男性がメッセージを送りたい年齢の幅より狭いことがわかります。 3538>

図2より、一般的に、男性にメッセージを送る女性(多くは12cm)は、女性にメッセージを送る男性(多くは10cm)よりも、相手を選ぶ際の身長差が大きくなっていることがわかります。 中国では、男性は「相手より10cm高い」、女性は「相手より12cm低い」ことが理想的な身長差とされています。 ヤフーの出会い系広告のデータによると、アメリカのユーザーも、特に女性は身長が重要視されているようです。 図2を見ると、女性の方が男性よりも身長差の幅が小さく、女性が受け入れる最低身長は3cm、最高身長は30cmであり、男性が受け入れる最低身長は13cm、最高身長は32cmである。 女性は、身長に対する好みで、好き嫌いが分かれるという特徴があります。 3538>

出会い系サイトでは、利用者の特徴はすべて自己申告であることが注目される。 印象管理のために、ユーザーは自分の個人的な特徴を誇張することができます。 例えば、オーストラリアの若年成人を対象に、オンラインで自己申告した身長と客観的に測定したデータを比較した最近の研究では、自己申告した身長は、男性で平均1.79cm、女性で1.29cmと、大幅に過大評価されていることが明らかになりました。 また、男性は女性よりも身長について嘘をつくことが多く、これはニューヨークのオンラインデートの参加者にも見受けられた . また、出会い系サイトでは、ユーザーは自分の身長を正確に申告していないようである。 このデータセットでは、女性ユーザーの平均身長は161.99cm( \mathit{SD}=4.18 )、男性ユーザーの平均身長は173.08cm( \mathit{SD}=4.68 )である。 しかし、現実の中国の成人女性の平均身長は160.88cm、成人男性の平均身長は169.00cmであり、女性ユーザーは平均1.11cm、男性ユーザーは4.08cm身長を誇張することができることになります。 これを補正すると、実際の身長差は、男性で \(10-(4.08-1.11) = 7.03text{ cm}) 、女性で \(12-(4.08-1.11) = 9.03text{ cm}) となり、大きな差が出ることが分かる。 しかし、出会い系サイトの利用者の平均年齢が男性28.73歳、女性28.58歳であるのに対し、中国の成人人口全体では、国勢調査によると、男性40.56歳、女性41.01歳であることにも注目されます。 3538>

Attribute preference

ユーザーが他のユーザーにメッセージを送るとき、その受信者の選択はランダムではなく、特定の属性、例えば雇用、教育、収入などに対する好みを持っているかもしれない。 属性iの送信者が属性jの受信者に対して持つ選好を特徴付けるために、属性iのユーザから属性jのユーザへ送信されたメッセージの数を閾値として、(m_{ij}) とする。 \(m_{i}) is total number of messages from users with attribute i, \(n_{j}) is number of receivers with attribute j, and the total number of receivers, then the attribute preference is \(p_{ij} = m_{ij} /m_{i} – n_{j} /n}). \■(p_{ij}>0}) はランダム選択と比較して、属性iの送信者が属性jの受信者に対して選好性があることを示し、■(p_{ij}=0} は選好性がないことを、■(p_{ij}<0}) は負の選好性、即ち、属性jの受信者に対して選好性があることを示している。 図3、図4に雇用形態を示す(属性の意味、雇用形態ごとの男女比と人数は追加ファイル1の表1、表2を参照)。 男性が女性にメッセージを送る場合と比較して、女性ユーザーが男性ユーザーにメッセージを送る場合は、潜在的な相手の職業をより強く選好していることがわかります。 図3では、学生、会計士、教育者など分類されていない職業の女性は男性に好まれず、デザインに携わる女性は相対的なメッセージの受信量でやや人気があり、特に航空サービス業の男性に人気があることが分かります。 一方で、本データでは、家事代行に従事する男性が経理の女性にしかメッセージを送らない、翻訳業に従事する男性が個人事業主の女性にしかメッセージを送らないということも分かっており、これらの属性に関するユーザー行動のサンプル数が少ないことが原因である可能性があります。

Figure 3

男性ユーザーが女性ユーザーにメッセージを送る際の職業嗜好性。 縦軸は男性の職業、横軸は女性の職業を表している。 3538>

Figure 4

女性ユーザーが男性ユーザーへメッセージを送る際の就業選好度を色分けして表示している。 縦軸は女性の職業、横軸は男性の職業を表している。 プリファレンス値は異なる色で表現

図4から、男性に人気のある職業は、上級管理職、金融、教育、個人事業主であることがわかります。 この4つの職業に就いている人は、高収入であったり、高学歴であったりする人が多いようです。 不人気な男性ユーザーは、学生、営業マン、その他分類されていない職業に就いている人である。 一方、化学工業に従事する女性は教育訓練に従事する男性を、スポーツに従事する女性は個人事業主の男性を求める傾向があり、警察に従事する女性は金融・不動産に従事する男性にしかメッセージを送っていないが、これもこれらの属性に関するユーザー行動のサンプル数が少ないことに起因していると考えられる。

教育水準は交際・結婚に大きな影響を与えている. 図5と図6に学歴嗜好を示す(属性の意味、各学歴の男女比と人数は追加ファイル1の表3、4参照)。 中国でも、他の国と同様、ポストドクターは学歴ではなく職位を指す。 しかし、中国の多くのサイトでは、ユーザー登録時に、博士以上の学歴として、ポストドクターも考慮されている。 同様に、男性が女性にメッセージを送る場合と比較して、女性ユーザーが男性ユーザーにメッセージを送る場合、相手候補の学歴に対する選好が強くなることがわかります。 図5から、学歴が学部以下の男性は自分と同じかそれ以下の学歴の女性を、学歴が学士以上博士以下の男性は学士以上の女性を、博士号取得者や博士課程修了者は大学院卒の女性を探す傾向があることがわかる。 学歴の好みについては、一般的に男性は好き嫌いが激しいという特徴がある。 女性から男性へのメッセージでは、学部卒と大学院卒の男性に人気があり、多くの女性では学部卒の男性に人気が集まっているが、大学院卒の女性は大学院卒の女性を求める傾向があることが図6からわかる。 また、学歴の好みについては、一般的に女性はポテンシャル・アトラクション的な性格を持っている。 ドイツの出会い系サイトでの調査では、学歴が近い相手を好む傾向は、学歴が上がるにつれて強くなることが明らかになった。 女性は学歴の低い男性とのコミュニケーションに消極的だが、男性は学歴の低い女性とのコンタクトに障壁はない。

Figure 5

男性から女性へのメッセージにおける学歴の優先度。 縦軸は男性の教育レベル、横軸は女性の教育レベルを示している。 3538>

Figure 6

女性ユーザーが男性ユーザーへメッセージを送る際の教育レベルの優先順位です。 縦軸は女性の教育レベル、横軸は男性の教育レベルを示している。 プリファレンスの値は異なる色で表されている。 ポストドクターの女性はデータセット内で男性にメッセージを送っておらず、該当行の要素を0

教育水準と所得は、その人の社会・経済状態を表す重要な2つの指標であると言えるでしょう。 図7と図8から(属性の意味と各収入レベルの男女の数と割合は、追加ファイル1の表5と表6を参照)、収入レベルの観点からは、女性に比べて男性ユーザーの潜在的な伴侶選択に関する明らかな選好は少ないことが分かります。 一方、図7に示すように、すべての男性は、月収が5000元から1万元(人民元は中国の通貨で、1元=0.145米ドル=0.128ユーロ)の女性を明らかに好み、収入が2000元以下の女性は明らかに排除されている。 しかし、男性は、収入が1万元以上の女性に対しては、明らかな選好や排除を示さない。 一方、図8に示すように、女性は皆、年収5000元以下の男性を嫌っており、年収1万元から2万元の男性に人気が集まっている。 収入レベルに対する好みという点では、一般的に女性も潜在的な魅力があることがわかる。 中国の出会い系サイトでの実証実験では、男性は異なる収入の女性のプロフィールをほぼ同じ割合で訪問したが、女性は男性の収入が高いほどプロフィールを訪問する割合が高く、今回の調査結果とは異なることが分かった。

Figure 7

女性へメッセージを送る男性ユーザーの月収レベルの優先度。 縦軸は男性の収入レベル、横軸は女性の収入レベルを示す。 3538>

Figure 8

女性ユーザーが男性ユーザーにメッセージを送る際の月収に対する優先順位です。 縦軸は女性の収入レベル、横軸は男性の収入レベルを示す。 3538>

Logistic regression classification

Compatibility scores

ユーザーの個人ホームページでは、各ユーザーが潜在的なパートナーに対する要求を示している。年齢、アバター、教育レベル、身長、信用度、居住地、配偶者の有無である(各属性の選択条件は、Additional file 1の図1-4を参照)。 信用度については、出会い系サイトでは、簡単な本人認証に合格するか、3つの書類(IDカード、パスポート、香港・マカオパス)のいずれかをアップロードして審査に合格すると、最初の星、すなわち信用度1が得られる。 最初の星を基準に、新しい書類がアップロードされ承認されるたびに、星や評価が追加されます(最大5つの星、すなわち5つ星会員)。 また、本プラットフォームでは、最低年齢を18歳としていますが、18歳未満に設定しているユーザーはまだほとんどいません(詳細は、Additional file 1のFig.3を参照)。 そこで、あるユーザーが他のユーザーの選択条件を満たしているかどうかで、ユーザー間のマッチングを表す「相性スコア」の概念を適用する。 女性が男性にメッセージを送る場合、各メッセージ、各属性について、男性の交際相手の好みに合う女性の割合と、女性の好みに合う男性の割合、つまり7つの割合を含む2つのベクトルを得ることができます。 このデータから、Ⓐ(Ⓐ_{mathbf{w}= (0.701,0.886,0.462,0.826,0.919,0.786,0.920)) Ⓕ(Ⓕ_{mathbf{w}= (0.912,0.976,0.681,0.962,0.994,0.864,0.)) が得られ、ⒸⒻはⒸⒸⒸⒻとⒸⒻで表される。912)\), ここで, \(\mathbf{w}_{mathrm{FMm}}) は男性の好みに合う女性属性の割合, \(\mathbf{w}_{mathrm{FMf}}) は女性の好みに合う男性属性の割合である. 同様に、男性が女性にメッセージを送る場合、 \(0.877,0.977,0.402,0.980,0.992,0.831,0.960)\) and \(\mathbf{w}_{\mathrm{MFf}}=(0.671,0.867,0.572,0.678,0.758,0.771,0.892)\). したがって、女性が男性にメッセージを送るときの相性スコアは、

$$begin{aligned}& c_{mathrm{FMm}} = \frac{THMATSBF{W}_{mathrm{FMm}}} となる。 \⑭テキストム{男性用プリフライトの中の女性用プリフライト})}}{ {operatorname{sum}(\mathbf{w}_{mathrm{FMm}} )}}, \end{aligned}$$
(1)
$$begin{aligned}& c_{mathrm{FMf}} = \frac{Thematbuf{w}_{Mathrm}} {Matbf{FMf}} {mathbf} {Mathmf} {Mathmf} {Mathmf} {Mathb} {Mathmf} {Mathmf} {Mathmf} } }}, {Mathmf}

(2)

また、男性が女性にメッセージを送る際の相性スコアは

$$begin{aligned}& c_{mathrm{MFm}} = \frac{Tathbf{w}_{mathrm{MFm}}} 。 \ⅳtextrm{male attr. in male pref.(})}{ {operatorname{sum}(\mathbf{w}_{mathrm{MFm}} )}}, \end{aligned}$$
(3)
$$begin{aligned}& c_mathrm{MFf} = \frac{THMATSBF{w}_{Mathrm{MFf}} {THMATSBF{mFm}} {THMATSBF{W}} {THMATSBF}} {THMATSBF{W}} {THMATSBF{MFm}} {THMATSBF{MFm \cdot (\textrm{male attr. in female pref. })}{ {operatorname{sum}(\mathbf{w}_{mathrm{MFf} )}}, \end{aligned}$
(4)

where (female attr. in male pref.(female attr. in male pref.)は、2人のユーザーに対して、女性の属性が男性の好みに合っているかどうかを特徴付けるベクトル(1ならYes、0ならNo)であり、同様に(male attr. in female pref.)は、2人のユーザーに対して、男性の属性が女性の好みに合っているかを特徴付けるベクトルである。 式1と式3は、男性の好みと選んだ相手のプロフィールの相性スコアであり、式2と式4は、女性の好みと選んだ相手のプロフィールの相性スコアである。 また、2人のユーザー( \(u_{a}}), \(u_{b}) )に対して、 \(u_{b}) の属性がどれだけ \(u_{a}) のpreferences と一致するか、また、 \(u_{a}) の属性がどれだけ u_{b}) のpreferences と一致するかを定量的に表すスコア、つまりreciprocal scoreを使用します。 また、(u_{a}}と(u_{b}})の相性スコアの平均は、(u_{a}}と(u_{b})の相性スコアの平均となります。 女性が男性にメッセージを送る場合の相互得点は、 \(\mathit{rs} = (c_{mathrm{FMm}} + c_{mathrm{FMf}} )/2})、男性が女性にメッセージを送る場合は、 \(\mathit{rs} = (c_{MFm} + c_{mathrm{MFf}} )/2})となります。

ロジスティック回帰

あるユーザーがクリックされた回数をclick、あるユーザーが受け取ったメッセージの数をmsg、あるユーザーが他のユーザーのホームページに推薦されて表示された回数をrecとすると、recは、あるユーザーが他のユーザーのホームページに推薦された回数を示す。 を定義し、行動によるユーザーの人気度を特徴付けることができる。 また、PageRank中心性( \mathit{pop}_{3}) は、ネットワーク上の全ての接続を考慮し、あるユーザーがネットワーク上でどれだけ中心的で人気があるかを定量化するものである。 このことは、Sect.3 の収入と教育レベルの嗜好分析で明らかにすることができる。 3.1.2. 魅力的な人から魅力的だと思われる人は、さらにモテる/モテるようになる可能性がある。 本稿で使用した変数とその意味は表1の通りである。

Table 1 Variables and their corresponding meaning

中心性指標である \(\mathit{pop}_{1}), \(\mathit{pop}_{2}), indegree, and indegree を導入し、メッセージ行動との相関を評価する。 ただし,中心性指標はユーザの好感度や人気度を表す集計指標であり,ユーザは自分の指標を知らず,他人の指標も知らない. また、ユーザの活動度を表す指標として外延度を用いるが、出会い系サイトでは、ユーザは他のユーザの外延度を知らない。 現実には、魅力的な相手を特定・選択するために指標を用いるのではなく、より具体的な手がかり、例えば高収入、高学歴、魅力的な写真、人口学的・社会経済的な相性の良さなどに基づいて、ユーザーは別の相手にメッセージを送ることになるのです。

女性ユーザーiのメッセージ送信確率を \(p_{i}) 、メッセージを送信しない確率を \(1-p_{i}) とすると、L_{f_{i}}= \ln(\frac{p_{i}}{1-p_{i}})、すなわち, の場合、すべての女性で、 \(L_{f}=Thanky(\frac{p}{1-p})\) となります。 同様に、男性ユーザiのメッセージ送信確率を \(q_{j}) 、メッセージ送信しない確率を \(1-q_{j}) とすると、 \(L_{m_{j}}=(\frac{q_{j}}{1-q_{j})\) 、即ち。 の場合、男性全体では、 \(L_{m}= \ln(\frac{q}{1-q})\) となる。 というロジスティック回帰モデルを得ることができる。

$$begin{aligned}& L_{f} = \alpha _{1}. + {boldsymbol{beta} }_{1} \ȂȂȂ + \varepsilon _{mathrm}, \end{aligned}$$
(5)
$$begin{aligned}& L_{m} = \alpha _{2}, L_{m} = L_{2}, L_{m} = L_{2}, L_{3}

本研究では,相関係数が 0.5 未満の独立変数を見つけるために多重共線性検定を行っている(詳細は追加ファイル 1 の表 7,8 を参照). 女性が男性にメッセージを送る場合のロジスティック回帰の結果を表2に示す。 女性の属性(送信者の属性)のみを考慮した場合(モデル1)、ほぼすべての変数が有意であることがわかるが、女性の住居と外延のみが、女性が男性にメッセージを送信する確率と正の相関を持つことがわかる。 男性の属性のみを考慮した場合(モデル2)、男性の携帯電話認証と信用度以外は有意であり、女性のメッセージ送信確率と正の相関があることがわかる。 両者の属性と相性スコアを考慮した場合(モデル3)、有意な変数のうち、女性の携帯電話認証、車所有、信用度、人気度( \mathit{pop}_{1}, \mathit{pop}_{3} )が女性のメッセージ送信確率と負に、他の変数が正に関連することが分かりました。 このことから、女性は男性にメッセージを送る際に、男性の要求を満たしているかだけでなく、男性が自分の要求を満たしているかどうかを気にしていることがわかった。

表2 女性ユーザーが男性ユーザーにメッセージを送る場合のロジスティック回帰結果

男性が女性にメッセージを送る場合のロジスティック回帰結果は表3に示す通りである。 女性の属性のみを考慮した場合(モデル1)、女性の携帯電話認証、信用度、学位以外の変数はすべて有意であるが、女性の住居所有のみが男性のメッセージ送信確率に負の影響を与えることが分かる。 男性の属性のみを考慮した場合(モデル2)、すべての変数が有意であるが、男性の学位のみがメッセージング行動と正の相関を持ち、その他は負の相関を持つ。 すべての変数を考慮した場合(モデル3)、女性の信用度、外見度、女性の好みと対応する相手側のプロファイルの互換性スコアを除き、他のすべての変数が有意であった。 有意な変数のうち、女性の携帯電話認証、車所有、人気度( \(\mathit{pop}_{1}), \(\mathit{pop}_{2}), \(\mathit{pop}_{3}) )、男性のoutdegree、男性の好みと対応する相手プロファイルの相性スコアはメッセージング行動と正相関、他の変数はすべて負相関であることがわかる。 また、2つの相性スコアの有意性を分析することで、男性は女性にメッセージを送る際に、女性が自分の条件を満たしているかどうかにのみ注目していることがわかった。

表3 男性ユーザーが女性ユーザーにメッセージを送る場合のロジスティック回帰結果

表2、3からわかるように、メッセージを送る男性または女性にとって、相手方の人気はメッセージング行動と有意に正の相関があることがわかる。 3538>

女性が男性にメッセージを送る場合、男性用の \(\exp (0.390) = 1.477} が、男性用の \(exp (0.) = 1.477}) より大きい。146) = 1.157)、男性から女性へのメッセージ送信では、女性(˶‾‾‾˵)の \(\exp (0.462) = 1.587) は、女性(˶‾‾‾˵)の \(\exp (0.141) = 1.151) より大きくなっています。 このように、男性、女性ともに、相手方の \(\mathit{pop}_{1}) は \(\mathit{pop}_{3}) よりも重要であることがわかる。 また、女性から男性へメッセージを送る場合、男性側の \(\exp (0.390) = 1.477***) は、男性側の \(\exp (0.462) = 1.477***) よりも小さいことが分かりました。587)よりも小さいことから、男性は女性に比べ、相手のメッセージ行動との関連性が高いことが分かる。 しかし、女性が男性にメッセージを送る場合、男性の \(\exp (0.146) = 1.157***) は、男性の \(\exp (0.141) = 1.157***) よりも大きくなることが分かりました。151)よりも大きく、男性から女性へのメッセージ送信では、女性 の \(\mathit{pop}_{3}) の方がメッセージ行動との関連性が高いこ とが分かる。

中国では、マンションや車を持つことはその人の富や社会的地位の象徴であり、地域によっては結婚するための必需品になっている。 女性が男性にメッセージを送るとき、男性が家と車を持っていることが重要なのです。 男性が女性にメッセージを送るとき、女性が家を持っていることは重要ではないが、女性が車を持っていることは多少重要である。 男性から女性へのメッセージの場合、相手が車を持っているかどうかの \exp(0.038) = 1.039 は、女性から男性へのメッセージの場合、相手が車を持っているかどうかの \exp(0.157) = 1.170 より小さく、女性は男性よりも相手が車を持っているかどうかに注目することが分かる。 一見、活動度が高いように見えるのは、他の多くのユーザーと接触していることを意味するが、本来は、潜在的なパートナーを見つけようとするために、より多くの時間とリソースを投資していることを意味するのかもしれない。 Outdegreeは、男性と女性で異なる属性です。 女性が男性にメッセージを送る場合、相手のoutdegreeはメッセージング行動と有意に正の相関を示すが、男性が女性にメッセージを送る場合には、そのようなことはない。 女性が男性にメッセージを送る場合、接触した男性の人気度や活動度などのネットワーク指標がメッセージング行動と有意に正の相関を示すが、男性が女性にメッセージを送る場合、接触した女性の人気度などのネットワーク指標のみがメッセージング行動と有意に正の相関を示す。

Ensemble Learning classification

ビッグデータ時代の到来とともに、ソーシャルネットワーク研究分野において、徐々にensemble learning classification methodが導入され始めている。 1996年にはBreimanがbaggingを提案し、その5年後にはさらにRandom Forestを提案した。 Freundは1997年にAdaBoost法を提案し 、機械学習分類器の継続的な改良に伴い、2016年にChenらは分類器-XGBoostを提案し、いくつかのケースでアルゴリズムの効率と正確さを大幅に向上させることができます。 アプリケーションとして、最近ReeceらはすでにInstagramの写真からうつ病を識別するために機械学習ツールを適用しました。

回帰分析では、多重共線性がないなど、独立変数に一定の要件があることが多いですが、アンサンブル学習分類法は独立変数に対する制約を緩和しています。 ここでは、バギング、ランダムフォレスト、AdaBoost、XGBoostなどのアンサンブル学習による分類法を用いて、表1の各属性の重要度を評価する。 AdaBoost 法と bagging 法を行うために R ソフトウェアのパッケージ ‘adabag’ を、Random Forest 法を行うためにパッケージ ‘randomForest’ を、XGBoost 法を行うためにパッケージ ‘xgboost’ を使用する。 データセットについては,5-fold cross validation を用いて分類器の性能を評価し,安定したエラーレートが得られるようにアルゴリズムのパラメータを選択した. 3538>

4つのアンサンブル学習分類法の誤差を表4に示す。 女性が男性にメッセージを送る場合はRandom ForestとAdaBoostの誤差率が最も低く、男性が女性にメッセージを送る場合はXGBoostの誤差率が最も低いことが分かる。 属性の重要度ランキングを図9、図10に示す。 図9より、女性が男性にメッセージを送る場合、最も重要な3つの属性は、男性は “outdegree”、女性は” \mathit{pop}_{1}}” の値であり、”outdegree “は “outdegree “であることが分かる。 同様に、図10より、男性が女性にメッセージを送る場合、最も重要な3つの属性は、女性の場合は \(⊖mathit{pop}_{3}) とoutdegree、男性の場合は \(⊖mathit{pop}_{1}) であることがわかる。 男女ともにメッセージ送信の意思決定を予測する最も重要な要因は、ロジスティック回帰においてもメッセージ送信行動と有意に正の相関を示した、潜在的な交際相手の人気度を表す「 \mathit{pop}_{3} 」「 \mathit{pop}_{1} 」値であった。

図9

分類方法別に、女性が男性にメッセージを送る際の属性相対重要度ランキングを示したもの。 横軸は属性、縦軸はそれに対応する重要度を示している。 Bagging、Random Forest、AdaBoostでは、分類タスクにおける各変数の相対的重要度はGini指数で測定され、XGBoostでは相対的重要度はGainパラメータ

図10

分類方法別の男性が女性にメッセージを送ったときの属性相対重要度ランキング。 横軸は属性、縦軸はそれに対応する重要度を示している。 バギング、ランダムフォレスト、AdaBoostでは、分類タスクにおける各変数の相対的重要度をジニ指数で、XGBoostでは相対的重要度をゲインパラメータで測定する

表4 アンサンブル学習分類法による誤り率

ロジスティック回帰分析と異なる目的を持ってアンサンブル学習分類を行っている。 図9、図10によると、確かに中心性指標が圧倒的に重要であり、他の変数は相対的に予測力がないことがわかる。 3538>

戦略的行動分析

戦略的行動の概念は経済学に由来し、その原意は、企業が利益を上げるために市場環境に影響を与える行動を取ることであり(本研究ではメッセージ応答率を参照)、これは次に、仲間マッチングなどのマッチング問題に拡張されます。

本研究では、戦略的行動とは、あるユーザーが他のユーザーにメッセージを送るかどうかは、その決断によってメッセージの返信確率が上がるかどうかに依存することを意味する。 ユーザの応答データがないため、ユーザの人気を表す中心性指標を用いて、ユーザが自分より人気のある人にメッセージを送る傾向があるか、人気のない人にメッセージを送る傾向があるかを分析したい。 そこで、中心性指標間の相関を分析することで、ユーザの戦略的行動を検討する。 一般化加法モデルによる相関の平滑化フィッティング曲線は,ユーザの中心性指数間に非線形または近似的な線形関係があることを示す(詳細はAdditional file 1の図5,6参照)ので,スピアマン相関係数を用いて相関を特徴付ける. 表5、6に示すように、出会い系サイトでは、ネットワーク環境における拒絶のコストが低減されているにもかかわらず、メッセージングにおいて男女で異なる行動パターンを示すことがわかりました。 男性が女性にメッセージを送る場合、中心性指数間には弱い正の相関が存在し、それは小さな正の相関係数と有意な相関係数で特徴づけることができます。一方、女性が男性にメッセージを送る場合、中心性指数間には弱い、あるいは適度な正の相関が存在し、それは小さな正の相関係数かわずかに大きな正の相関係数と有意な相関係数で特徴づけています。 男性はメッセージの送信時にあまり戦略的な行動をとらないが、女性は自分の中心性指数が上昇すると、メッセージを受け取った男性の中心性指数も上昇する可能性がある。

表5 女性が男性にメッセージを送るときの中心性指数間のスピアマン相関係数
表6 男性が女性にメッセージを送るときの中心性指数間のスピアマン相関係数

同じ中心性指数の組同士の相関を調べることにより、ユーザーごとに中心性指数が異なることがわかる。 さらに、ユーザーが自分より人気のある人にメッセージを送る傾向があるのか、それとも人気のない人に送る傾向があるのかを分析した。 送信者の各中心性指数について、対応する受信者の指数の平均と標準偏差、および受信者の中心性指数が送信者のそれよりも大きい割合を、追加ファイル1の図7と図8に示した。 また、各中心性指数について、メッセージ送信時に受信者の中心性指数が送信者の中心性指数より大きくなる割合を表7に示す。 比較として、ランダム化した結果も示す。 男性に比べ、女性の方が自分より人気のある人にメッセージを送る傾向があることがわかる。

表7 メッセージ送信時の受信者の中心性指標が送信者のそれよりも大きい割合

オンラインデートにおけるユーザーの戦略行動についてはいくつかの研究がある。 いくつかの研究では、男性ユーザーの人気と女性ユーザーの人気の間に有意な正の相関があることを発見している。 例えば、Taylorらによる米国のユーザーを対象とした研究では、必ずしも成功率(より多くの応答を受け取ること)が高いとは限らないが、自分と相対的に人気の高い他のユーザーを選択したり、選択されたりする傾向があることが示されている。 また、あるオンライン・デート・サイトの米国4都市のユーザーを対象にした最近の実証分析では、PageRankを使って彼らの望ましさを特徴付け、男女ともに自分よりも平均約25%望ましい相手にメッセージを送っていることがわかりました。 しかし、ユーザーの人気度との相関を見いだせなかった研究もある。 例えば、ボストンとサンディエゴのユーザーを対象とした研究では、戦略的行動の証拠は見つからなかった . また、アメリカ南西部の中規模都市のオンラインデーティングデータを用いた研究では、ユーザーの身体的魅力、人気、人柄、物質的資源を特徴付ける自分の望ましさのレベルに関わらず、男女ともに社会的に最も望ましいユーザーにメッセージを送る傾向があることが明らかになりました . このように、プラットフォームや文化的背景が異なると、ユーザーの戦略的行動も異なることが分かっており、そのメカニズムについては、今後さらに検討する必要があると考えられます。

コメントを残す

メールアドレスが公開されることはありません。