Analyse der Attributpräferenz

Verteilung der Attributunterschiede

Beim Online-Dating gibt es signifikante geschlechtsspezifische Unterschiede in Bezug auf Attributpräferenz, Selbstdarstellung und Interaktion. Die Nutzer haben in der Regel eine bestimmte Vorliebe für das Alter oder die Größe des Partners. Wenn Männer und Frauen Nachrichten an ihre potenziellen Partner senden, berechnen wir den Altersunterschied als Alter (Empfänger) – Alter (Sender) und den Größenunterschied als Größe (Empfänger) – Größe (Sender). Die Abbildungen 1 und 2 zeigen die Verteilungen des Altersunterschieds bzw. des Höhenunterschieds. Zum Vergleich zeigen wir auch die randomisierten Ergebnisse, indem wir davon ausgehen, dass weibliche (männliche) Nutzer zufällig Nachrichten an männliche (weibliche) Nutzer senden.

Abbildung 1

Altersunterschiedsverteilung. FM bedeutet, dass weibliche Nutzer Nachrichten an männliche Nutzer senden und MF bedeutet, dass männliche Nutzer Nachrichten an weibliche Nutzer senden. Die durchgezogenen Linien stellen die lokal gewichtete polynomiale Regressionsanpassung der entsprechenden Datenpunkte dar, und das graue Intervall repräsentiert einen 95%igen Vertrauensbereich

Abbildung 2

Höhenunterschiedsverteilung. FM steht dafür, dass weibliche Nutzer Nachrichten an männliche Nutzer senden und MF steht dafür, dass männliche Nutzer Nachrichten an weibliche Nutzer senden. Die durchgezogenen Linien stellen die lokal gewichtete polynomiale Regressionsanpassung der entsprechenden Datenpunkte dar, und das graue Intervall stellt einen 95 %-Vertrauensbereich dar

In den meisten Zeiten und Orten heiraten Frauen gewöhnlich ältere Männer. Abbildung 1 zeigt, dass in der modernen chinesischen Gesellschaft Männer im Durchschnitt Frauen bevorzugen, die zwei Jahre jünger sind als sie, und Frauen Männer, die zwei Jahre älter sind als sie. Allerdings ist die Spanne des Altersunterschieds, den Frauen akzeptieren, kleiner als die der Männer: Das Mindestalter, das Frauen akzeptieren, ist, dass Männer 11 Jahre jünger sind als sie, und das Höchstalter, das sie akzeptieren, ist, dass Männer 23 Jahre älter sind als sie, während das Mindestalter, das Männer akzeptieren, ist, dass Frauen 25 Jahre jünger sind als sie, und das Höchstalter, das sie akzeptieren, ist, dass Frauen 28 Jahre älter sind als sie. Betrachtet man nur die Verteilungen der Altersunterschiede, so stellt man im Einklang mit früheren Erkenntnissen aus verschiedenen Kulturen und Religionen fest, dass die Altersspanne, in der Frauen bereit sind, Nachrichten zu übermitteln, kleiner ist als die Altersspanne, in der Männer bereit sind, Nachrichten zu übermitteln. Die Präferenzen von Männern und Frauen sind nicht zufällig; sie suchen nach potenziellen Partnern mit einem geringeren Altersunterschied, als durch eine zufällige Auswahl vorhergesagt wird, was das Merkmal der Anziehung durch Sympathie zeigt.

Abbildung 2 zeigt, dass im Allgemeinen der Größenunterschied für Frauen, die Nachrichten an Männer senden (die meisten sind 12 cm), größer ist als der für Männer, die Nachrichten an Frauen senden (die meisten sind 10 cm), wenn sie potenzielle Partner auswählen. In China ist der ideale Größenunterschied für Männer, dass sie 10 cm größer als die Person sind, der sie eine Nachricht schicken, während für Frauen der ideale Größenunterschied darin besteht, dass sie 12 cm kleiner als die Person sind, der sie eine Nachricht schicken. Nach den Daten der Yahoo!-Dating-Kontaktanzeigen spielt die Körpergröße für Nutzer in den USA bei der Partnersuche ebenfalls eine Rolle, insbesondere für Frauen. In Abb. 2 ist die Spanne der Größenunterschiede bei Frauen kleiner als bei Männern: Frauen akzeptieren mindestens, dass Männer 3 cm kleiner sind als sie, und maximal, dass Männer 30 cm größer sind als sie, während Männer mindestens akzeptieren, dass Frauen 13 cm kleiner sind als sie, und maximal, dass Frauen 32 cm größer sind als sie. Frauen zeigen das Merkmal der Anziehungskraft in Bezug auf die Körpergröße. Wie auch beim Alter suchen die Nutzer potenzielle Partner mit einem geringeren Größenunterschied als durch die zufällige Auswahl vorhergesagt, obwohl der Unterschied nicht so offensichtlich ist wie der Altersunterschied.

Es ist bemerkenswert, dass auf der Dating-Website die Merkmale der Nutzer alle selbst angegeben werden. Aus Gründen des Eindrucksmanagements können die Nutzer ihre persönlichen Merkmale übertreiben. So ergab eine kürzlich durchgeführte Untersuchung über die online selbst angegebene Körpergröße im Vergleich zu objektiv gemessenen Daten bei jungen australischen Erwachsenen, dass die selbst angegebene Körpergröße bei Männern um durchschnittlich 1,79 cm und bei Frauen um 1,29 cm deutlich überschätzt wird. Männer lügen in Bezug auf ihre Körpergröße mehr als Frauen, was auch bei den Online-Datern in New York City zu beobachten ist. Wir stellen fest, dass die Nutzer ihre Körpergröße auf der Dating-Website offenbar nicht genau angegeben haben. Im Datensatz beträgt die durchschnittliche Größe der weiblichen und männlichen Nutzer 161,99 cm (\(\mathit{SD}=4,18\)) bzw. 173,08 cm (\(\mathit{SD}=4,68\)). In der realen Welt liegt die durchschnittliche Größe von erwachsenen Frauen und Männern in China jedoch bei 160,88 cm bzw. 169,00 cm, was bedeutet, dass weibliche und männliche Nutzer ihre Größe im Durchschnitt um 1,11 cm bzw. 4,08 cm übertreiben können. Nach Korrektur dieser Werte ergibt sich, dass die tatsächlichen Größenunterschiede \(10-(4.08-1.11) = 7.03\text{ cm}\) für Männer und \(12-(4.08-1.11) = 9.03\text{ cm}\) für Frauen signifikant wären. Wir stellen jedoch auch fest, dass das Durchschnittsalter der männlichen und weiblichen Nutzer der Dating-Website 28,73 bzw. 28,58 Jahre beträgt, während das Durchschnittsalter der erwachsenen Gesamtbevölkerung in China laut Volkszählungsdaten bei 40,56 bzw. 41,01 Jahren liegt. Die Dating-Bevölkerung ist jünger als die erwachsene Gesamtbevölkerung und daher wahrscheinlich größer, und die Nutzer übertreiben ihre Körpergröße möglicherweise nicht ganz so stark wie berechnet.

Attributpräferenz

Wenn ein Nutzer eine Nachricht an einen anderen Nutzer sendet, ist seine Wahl des Empfängers möglicherweise nicht zufällig, sondern er hat eine gewisse Präferenz für bestimmte Attribute, wie z. B. die Präferenz für Beschäftigung, Bildung, Einkommen usw. Um die Präferenz des Senders mit Attribut i für den Empfänger mit Attribut j zu charakterisieren, sei \(m_{ij}\) die Anzahl der Nachrichten, die von Benutzern mit Attribut i an Benutzer mit Attribut j gesendet werden, \(m_{i}\) die Gesamtzahl der von Nutzern mit Attribut i gesendeten Nachrichten, \(n_{j}\) die Anzahl der Empfänger mit Attribut j und n die Gesamtzahl der Empfänger sein, dann ist die Attributpräferenz \(p_{ij} = m_{ij} /m_{i} – n_{j} /n\). \(p_{ij}>0\) zeigt an, dass im Vergleich zur Zufallsauswahl Sender mit Attribut i eine Präferenz für Empfänger mit Attribut j haben, \(p_{ij}=0\) zeigt an, dass es keine Präferenz gibt und \(p_{ij}<0\) zeigt eine negative Präferenz an, d.h.

Die Beschäftigungspräferenzen sind in den Abbildungen 3 und 4 dargestellt (siehe Tabellen 1 und 2 in Zusatzdatei 1 für die Bedeutungen der Attribute und die Anzahl und den Anteil der Männer/Frauen für jede Beschäftigung). Wir stellen fest, dass im Vergleich zu männlichen Nutzern, die Nachrichten an weibliche Nutzer senden, weibliche Nutzer, die Nachrichten an männliche Nutzer senden, eine stärkere Präferenz für die Berufe ihrer potenziellen Partner haben. Abb. 3 zeigt, dass Frauen, die als Studentinnen, Buchhalterinnen, Erzieherinnen oder in anderen nicht kategorisierten Berufen tätig sind, von Männern nicht bevorzugt werden, während Frauen, die im Bereich Design tätig sind, in Bezug auf die relative Anzahl der erhaltenen Nachrichten leicht beliebt sind, insbesondere bei Männern in der Luftfahrtdienstleistungsbranche. Gleichzeitig stellen wir fest, dass in diesen Daten Männer, die in der Hauswirtschaft tätig sind, nur Frauen aus der Buchhaltung Nachrichten schicken und Männer, die in der Übersetzungsbranche tätig sind, nur Frauen, die Privateigentümer sind, Nachrichten schicken, was auf die kleine Stichprobengröße des Nutzerverhaltens in Bezug auf diese Attribute zurückzuführen sein könnte.

Abbildung 3

Berufspräferenz für männliche Nutzer, die Nachrichten an weibliche Nutzer senden. Die vertikale Achse zeigt die männlichen Berufe und die horizontale Achse die weiblichen Berufe an. Die Präferenzwerte werden durch unterschiedliche Farben dargestellt

Abbildung 4

Beschäftigungspräferenz für weibliche Nutzer, die männlichen Nutzern Nachrichten schicken. Die vertikale Achse zeigt die weiblichen Berufe und die horizontale Achse die männlichen Berufe an. Die Präferenzwerte werden durch unterschiedliche Farben dargestellt

Aus Abb. 4 geht hervor, dass die beliebtesten Berufe für Männer die des leitenden Angestellten, des Finanzwesens, des Bildungswesens und der privaten Eigentümer sind. Die meisten Personen in diesen vier Berufen haben ein hohes Einkommen oder sind gut ausgebildet. Unbeliebte männliche Nutzer sind Schüler, Verkäufer und Personen, die in anderen nicht kategorisierten Berufen tätig sind. Gleichzeitig suchen Frauen, die in der chemischen Industrie tätig sind, eher Männer, die in der Bildung und Ausbildung tätig sind, Frauen, die im Sport tätig sind, suchen eher Männer, die Privateigentümer sind, und Frauen, die bei der Polizei tätig sind, senden in diesen Daten nur Nachrichten an Männer, die im Finanz- und Immobiliensektor tätig sind, was auch auf die kleine Stichprobengröße des Nutzerverhaltens in Bezug auf diese Attribute zurückzuführen sein kann.

Das Bildungsniveau hat einen signifikanten Einfluss auf Paarung und Heirat. Die Präferenzen für das Bildungsniveau sind in den Abbildungen 5 und 6 dargestellt (siehe Tabellen 3 und 4 in Zusatzdatei 1 für die Bedeutungen der Attribute und die Anzahl und den Anteil der Männer/Frauen für jedes Bildungsniveau). Wie in den anderen Ländern bezieht sich auch in China der Begriff Postdoktorat auf eine Position und nicht auf einen Bildungsabschluss. Allerdings wird auf vielen chinesischen Websites bei der Registrierung eines Nutzers der Postdoktoratstitel auch als ein über den Doktortitel hinausgehender Bildungsgrad angesehen. In ähnlicher Weise stellen wir fest, dass im Vergleich zu männlichen Nutzern, die Nachrichten an weibliche Nutzer senden, weibliche Nutzer, die Nachrichten an männliche Nutzer senden, eine stärkere Präferenz für das Bildungsniveau ihrer potenziellen Partner haben. Abbildung 5 zeigt, dass Männer, deren Bildungsniveau unter dem Bachelor liegt, eher nach Frauen suchen, die den gleichen oder einen niedrigeren akademischen Abschluss haben als sie selbst, Männer mit einem Bildungsniveau, das höher als der Bachelor, aber niedriger als der Doktortitel ist, eher nach Frauen mit Bachelor-Abschluss suchen, und Männer mit einem Doktortitel oder einer Postdoc-Ausbildung eher nach Frauen mit Hochschulabschluss. Was die Bevorzugung von Bildungsniveaus angeht, so zeigen Männer im Allgemeinen die Eigenschaft „gefällt mir“. Bei weiblichen Nutzern, die Nachrichten an männliche Nutzer senden, zeigt Abb. 6, dass Männer mit Bachelor- und Master-Abschluss beliebt sind, und dass bei den meisten Frauen Männer mit Bachelor-Abschluss beliebter sind, während Frauen mit Master-Abschluss eher nach potenziellen Partnern mit Master-Abschluss suchen. Was die Bevorzugung von Bildungsniveaus angeht, so zeigen Frauen im Allgemeinen die Eigenschaft, potenziell attraktiv zu sein. Untersuchungen auf einer deutschen Online-Dating-Website ergaben, dass die Vorliebe für einen ähnlichen Bildungshintergrund mit dem Bildungsniveau zunimmt. Frauen zögern, mit Männern mit niedrigerem Bildungsniveau zu kommunizieren, aber es gibt keine Barrieren für Männer, mit Frauen mit niedrigeren Bildungsabschlüssen Kontakt aufzunehmen.

Abbildung 5

Bildungsniveaupräferenz für männliche Nutzer, die Nachrichten an weibliche Nutzer senden. Die vertikale Achse zeigt das Bildungsniveau der Männer und die horizontale Achse das der Frauen an. Die Präferenzwerte werden durch unterschiedliche Farben dargestellt

Abbildung 6

Bildungsniveaupräferenz für weibliche Nutzer, die Nachrichten an männliche Nutzer senden. Die vertikale Achse zeigt das weibliche Bildungsniveau und die horizontale Achse das männliche Bildungsniveau an. Die Präferenzwerte werden durch unterschiedliche Farben dargestellt. Postdoktorandinnen haben in dem Datensatz keine Nachricht an Männer geschickt, und wir setzen die Elemente in der entsprechenden Zeile auf 0

Bildungsniveau und Einkommen sind zwei wichtige Indikatoren für den sozialen und wirtschaftlichen Status einer Person. Aus den Abbildungen 7 und 8 (siehe Tabellen 5 und 6 in Zusatzdatei 1 für die Bedeutung der Attribute und die Anzahl und den Anteil der Männer/Frauen für jede Einkommensstufe) geht hervor, dass die Präferenz bei der Auswahl potenzieller Partner für männliche Nutzer im Vergleich zu weiblichen Nutzern in Bezug auf die Einkommensstufen weniger offensichtlich ist. Einerseits bevorzugen, wie in Abb. 7 gezeigt, alle Männer offensichtlich Frauen, deren monatliches Einkommen zwischen 5.000 und 10.000 RMB liegt (der RMB ist die chinesische Währung, und 1 RMB = 0,145 US-Dollar = 0,128 Euro), während Frauen, deren Einkommen unter 2.000 RMB liegt, offensichtlich ausgeschlossen werden. Männer zeigen jedoch keine offensichtliche Bevorzugung oder Ausgrenzung von Frauen mit einem Einkommen von über 10.000 RMB. Wie aus Abb. 8 hervorgeht, lehnen dagegen alle Frauen Männer ab, die weniger als 5.000 RMB verdienen, und Männer mit einem Einkommen von 10.000 bis 20.000 RMB sind am beliebtesten. Was die Vorliebe für Einkommensstufen angeht, so zeigen Frauen im Allgemeinen auch die Eigenschaft „potenziell attraktiv“. Ein Feldversuch auf einer chinesischen Online-Dating-Website ergab, dass Männer die Profile von Frauen mit unterschiedlichem Einkommen in etwa gleich häufig besuchen, während bei Frauen die Besuchsrate ihrer Profile umso höher ist, je höher das Einkommen der Männer ist, was sich von unseren Ergebnissen unterscheidet.

Abbildung 7

Präferenz für das monatliche Einkommensniveau von männlichen Nutzern, die Nachrichten an weibliche Nutzer senden. Die vertikale Achse zeigt das Einkommensniveau der Männer und die horizontale Achse das Einkommensniveau der Frauen an. Die Präferenzwerte werden durch unterschiedliche Farben dargestellt

Abbildung 8

Präferenz für das monatliche Einkommensniveau weiblicher Nutzer, die Nachrichten an männliche Nutzer senden. Die vertikale Achse zeigt das Einkommensniveau der Frauen und die horizontale Achse das Einkommensniveau der Männer an. d. h. Alter, Avatar, Bildungsniveau, Größe, Bonität, Wohnort und Familienstand (siehe Abb. 1-4 in Zusatzdatei 1 für die Auswahlanforderungen der einzelnen Attribute). Was die Kreditwürdigkeit betrifft, so erhält ein Nutzer auf der Dating-Website, nachdem er die schnelle Identitätsprüfung bestanden oder eines der drei Dokumente (Personalausweis, Reisepass oder Hongkong- und Macau-Pass) hochgeladen und die Bewertung bestanden hat, den ersten Stern, d. h. die Kreditwürdigkeit ist gleich 1. Auf der Grundlage des ersten Sterns kann jedes Mal, wenn ein neues Dokument hochgeladen und genehmigt wird, ein weiterer Stern oder eine weitere Bewertung hinzugefügt werden (bis zu fünf Sterne, d. h. Fünf-Sterne-Mitglied). Obwohl das Mindestalter der Nutzer auf der Plattform 18 Jahre beträgt, gibt es immer noch sehr wenige Nutzer, die ihre Anforderungen an das Mindest- oder Höchstalter unter 18 Jahre setzen (siehe Abb. 3 in Zusatzdatei 1 für Details). Wir verwenden das Konzept der Kompatibilitätsbewertung, um die Übereinstimmung zwischen Nutzern zu beschreiben, die darauf basiert, ob ein Nutzer die Auswahlkriterien eines anderen Nutzers erfüllt oder nicht. Wenn Frauen Nachrichten an Männer senden, können wir für jede Nachricht und für jedes Attribut den Anteil der Frauen, die mit den Partnerschaftspräferenzen der Männer übereinstimmen, und den Anteil der Männer, die die Präferenzen der Frauen erfüllen, erhalten, d. h. wir können zwei Vektoren mit 7 Anteilen erhalten. Gemäß den Daten erhalten wir \(\mathbf{w}_{\mathrm{FMm}}= (0.701,0.886,0.462,0.826,0.919,0.786,0.920)\), und \(\mathbf{w}_{\mathrm{FMf}}=(0.912,0.976,0.681,0.962,0.994,0.864,0.912)\), wobei \(\mathbf{w}_{\mathrm{FMm}}) der Anteil der weiblichen Attribute ist, die den männlichen Präferenzen entsprechen, und \(\mathbf{w}_{\mathrm{FMf}}) der Anteil der männlichen Attribute, die den weiblichen Präferenzen entsprechen. In ähnlicher Weise erhalten wir, wenn Männer Nachrichten an Frauen senden, \(\mathbf{w}_{\mathrm{MFm}}=(0.877,0.977,0.402,0.980,0.992,0.831,0.960)\) and \(\mathbf{w}_{\mathrm{MFf}}=(0.671,0.867,0.572,0.678,0.758,0.771,0.892)\). Somit sind die Kompatibilitätswerte von Frauen, die Nachrichten an Männer senden,

$$\begin{aligned}& c_{\mathrm{FMm}} = \frac{\mathbf{w}_{\mathrm{FMm}} \cdot { (\textrm{weibliches Attr. in männlichem Präf.})}}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{FMm}} )}}, \end{aligned}$$
(1)

$$\begin{aligned}& c_{\mathrm{FMf}} = \frac{\mathbf{w}_{\mathrm{FMf}} \cdot (\textrm{male attr. in female pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{FMf}} )}}, \end{aligned}$$
(2)

und die Kompatibilitätswerte der Männer, die Nachrichten an Frauen senden, sind

$$$begin{aligned}& c_{\mathrm{MFm}} = \frac{\mathbf{w}_{\mathrm{MFm}} \cdot (\textrm{weibliches Attr. in männlichem Präf.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{MFm}} )}}, \end{aligned}$$
(3)

$$$\begin{aligned}& c_{\mathrm{MFf}} = \frac{\mathbf{w}_{\mathrm{MFf}} \cdot (\textrm{male attr. in female pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{MFf}} )}}, \end{aligned}$$
(4)

wobei (female attr. in male pref.) ein Vektor ist, der charakterisiert, ob weibliche Attribute mit männlichen Präferenzen für ein Benutzerpaar übereinstimmen (1 für ja und 0 für nein), und in ähnlicher Weise (männliche Attribute in weiblichen Präferenzen) ein Vektor ist, der charakterisiert, ob männliche Attribute mit weiblichen Präferenzen für ein Benutzerpaar übereinstimmen. Die Gleichungen 1 und 3 sind die Kompatibilitätswerte zwischen einer männlichen Präferenz und dem Profil der gewählten Partnerin, und die Gleichungen 2 und 4 sind die Kompatibilitätswerte zwischen einer weiblichen Präferenz und dem Profil der gewählten Partnerin. Für ein Paar von Nutzern, \(u_{a}\) und \(u_{b}\), verwenden wir eine Punktzahl, d.h. eine reziproke Punktzahl, um zu quantifizieren, wie sehr die Attribute von \(u_{b}\) mit den Präferenzen von \(u_{a}\) übereinstimmen und wie sehr die Attribute von \(u_{a}\) mit den Präferenzen von \(u_{b}\) übereinstimmen. Der reziproke Wert zwischen \(u_{a}\) und \(u_{b}\) ist der Mittelwert der Kompatibilitätswerte dieser beiden Nutzer, d. h, für Frauen, die Männern Nachrichten schicken, ist die reziproke Punktzahl \(\mathit{rs} = (c_{\mathrm {FMm}} + c_{\mathrm{FMf}} )/2\), und für Männer, die Frauen Nachrichten schicken, \(\mathit{rs} = (c_{\mathrm{MFm}} + c_{\mathrm{MFf}} )/2\).

Logistische Regression

Lassen Sie click die Anzahl der Klicks auf einen Nutzer, msg die Anzahl der von einem Nutzer erhaltenen Nachrichten und rec die Anzahl der Empfehlungen eines Nutzers, die auf den Homepages anderer Nutzer angezeigt werden, sein, definieren wir \(\mathit{pop}_{1} = \mathit{click}/\mathit{rec}\) und \(\mathit{pop}_{2} = \mathit{msg}/\mathit{rec}\), die die Popularität eines Benutzers auf der Grundlage von Aktionen charakterisieren können. Wir verwenden auch die PageRank-Zentralität (\(\mathit{pop}_{3}\)), um zu quantifizieren, wie fokal oder beliebt ein Benutzer in einem Netzwerk ist, indem wir alle Verbindungen im Netzwerk berücksichtigen. Attraktive Menschen, wie z.B. Menschen mit vorteilhaften demografischen Merkmalen und einem höheren sozioökonomischen Status, sind in der Regel anspruchsvoller bei der Partnerwahl als durchschnittliche Menschen, was sich in der Präferenzanalyse von Einkommen und Bildungsniveau in Abschnitt 3.1.2 zeigt. 3.1.2. Diejenigen, die von attraktiven Menschen als attraktiv wahrgenommen werden, können noch beliebter/attraktiver sein. Die in der Arbeit verwendeten Variablen und ihre Bedeutungen sind in Tabelle 1 dargestellt.

Tabelle 1 Variablen und ihre entsprechenden Bedeutungen

Wir führen verschiedene Zentralitätsindizes ein, wie \(\mathit{pop}_{1}\), \(\mathit{pop}_{2}\), \(\mathit{pop}_{3}\) und indegree, um ihre Korrelation mit dem Messaging-Verhalten zu bewerten. Es ist zu beachten, dass die Zentralitätsindizes aggregierte Indikatoren sind, die die Erwünschtheit oder Beliebtheit der Benutzer beschreiben, und dass die Benutzer weder ihre Indizes noch die Indizes anderer kennen. Wir verwenden den Outdegree, um das Aktivitätsniveau der Nutzer zu charakterisieren, und auf der Dating-Website kennen die Nutzer auch nicht den Outdegree der anderen Nutzer. In der Realität verwenden die Nutzer nicht die Indizes, um attraktive Partner zu identifizieren oder auszuwählen, sondern sie senden anderen Nutzern Nachrichten auf der Grundlage spezifischerer Anhaltspunkte, wie höheres Einkommen, besserer Bildungsstand, attraktive Fotos oder gute demografische und sozioökonomische Kompatibilität. In diesem Beitrag wird untersucht, ob die Indizes signifikant mit dem Nachrichtenverhalten verbunden sind.

Angenommen, \(p_{i}\) ist die Wahrscheinlichkeit, dass ein weiblicher Nutzer i Nachrichten sendet, \(1-p_{i}\) ist die Wahrscheinlichkeit, dass er keine Nachrichten sendet, dann ist \(L_{f_{i}}=\ln(\frac{p_{i}}{1-p_{i}})\), d.h., für alle Frauen, \(L_{f}=\ln(\frac{p}{1-p})\). Angenommen, \(q_{j}\) ist die Wahrscheinlichkeit des Versendens von Nachrichten für einen männlichen Nutzer i, \(1-q_{j}\) ist die Wahrscheinlichkeit des Nicht-Versendens von Nachrichten, dann ist \(L_{m_{j}}=\ln (\frac{q_{j}}{1-q_{j}})\), d.h., für alle Männer, \(L_{m}= \ln(\frac{q}{1-q})\). Wir erhalten logistische Regressionsmodelle wie folgt:

$$\begin{aligned}& L_{f} = \alpha _{1} + {\boldsymbol{\beta} }_{1} \cdot {\mathbf{attribute}} + \varepsilon _{\mathrm{1}}, \end{aligned}$$
(5)

$$\begin{aligned}& L_{m} = \alpha _{2} + {\boldsymbol{\beta }}_{2} \cdot {\mathbf{attribute}} + \varepsilon _{\mathrm{2}}. \end{aligned}$$
(6)

In dieser Studie werden Multikollinearitätstests durchgeführt, um die unabhängigen Variablen herauszufinden, bei denen die Korrelationskoeffizienten unter 0,5 liegen (siehe Tabellen 7 und 8 in Zusatzdatei 1 für Einzelheiten). Die Ergebnisse der logistischen Regression für Frauen, die Nachrichten an Männer senden, sind in Tabelle 2 dargestellt. Es zeigt sich, dass fast alle Variablen signifikant sind, wenn nur die Attribute der Frauen (Modell 1), d. h. die Attribute der Absender, betrachtet werden, aber nur die Wohnsituation und der Grad der Abwesenheit von Frauen sind positiv mit der Wahrscheinlichkeit verbunden, dass Frauen Nachrichten an Männer senden. Betrachtet man nur die männlichen Attribute (Modell 2), so sind außer der Verifizierung des Mobiltelefons des Mannes und der Kreditwürdigkeit alle anderen signifikant und stehen in positivem Zusammenhang mit der Wahrscheinlichkeit, dass Frauen Nachrichten versenden. Betrachtet man die Attribute beider Parteien und die Kompatibilitätswerte (Modell 3), so sind unter den signifikanten Variablen die Verifizierung des weiblichen Mobiltelefons, der Autobesitz, die Kreditwürdigkeit und der Beliebtheitsgrad (\(\mathit{pop}_{1}\) und \(\mathit{pop}_{3}\)) negativ mit der Wahrscheinlichkeit des Versendens von Nachrichten durch Frauen verbunden, während die anderen Variablen positiv damit verbunden sind. Wir stellen fest, dass Frauen, wenn sie Nachrichten an Männer senden, nicht nur darauf achten, ob sie die Anforderungen der Männer erfüllen, sondern auch, ob die Männer ihre eigenen Anforderungen erfüllen.

Tabelle 2 Logistische Regressionsergebnisse für weibliche Nutzer, die Nachrichten an männliche Nutzer senden

Die logistischen Regressionsergebnisse für Männer, die Nachrichten an Frauen senden, sind in Tabelle 3 dargestellt. Es zeigt sich, dass, wenn nur die weiblichen Attribute berücksichtigt werden (Modell 1), mit Ausnahme der Verifizierung des weiblichen Mobiltelefons, der Kreditwürdigkeit und des Abschlusses, alle anderen Variablen signifikant sind, aber nur der weibliche Hausbesitz die Wahrscheinlichkeit des Versendens von Nachrichten an Männer negativ beeinflusst. Wenn nur männliche Attribute berücksichtigt werden (Modell 2), sind alle Variablen signifikant, aber nur der männliche Outdegree ist positiv mit dem Messaging-Verhalten korreliert, die anderen sind negativ korreliert. Werden alle Variablen berücksichtigt (Modell 3), sind mit Ausnahme der weiblichen Bonität, des Outdegree und des Kompatibilitätswerts zwischen einer weiblichen Präferenz und dem Profil der entsprechenden Gegenseite alle anderen Variablen signifikant. Von den signifikanten Variablen sind die Handyverifikation der Frau, der Autobesitz, die Beliebtheit (\(\mathit{pop}_{1}\), \(\mathit{pop}_{2}\) und \(\mathit{pop}_{3}\)), der Outdegree des Mannes und die Kompatibilitätsbewertung zwischen einer männlichen Präferenz und dem Profil der entsprechenden anderen Seite positiv mit dem Messaging-Verhalten korreliert, während alle anderen Variablen negativ korreliert sind. Die Analyse der Signifikanz der beiden Kompatibilitäts-Scores zeigt außerdem, dass Männer beim Versenden von Nachrichten an Frauen nur darauf achten, ob die Frauen ihren eigenen Anforderungen entsprechen.

Tabelle 3 Logistische Regressionsergebnisse für männliche Nutzer, die Nachrichten an weibliche Nutzer senden

Wie aus den Tabellen 2 und 3 hervorgeht, ist die Beliebtheit der anderen Seite signifikant positiv mit dem Messaging-Verhalten verbunden. Einerseits stellen die Werte von \(\mathit{pop}_{1}\) und \(\mathit{pop}_{2}\) entsprechend ihrer Berechnungsmethode die lokale Popularität eines Nutzers dar. Andererseits repräsentiert der Wert \(\mathit{pop}_{3}\), d.h. der PageRank, die Popularität eines Nutzers aus einer globalen Perspektive.

Für Frauen, die Nachrichten an Männer senden, ist \(\exp (0.390) = 1.477\) für Männer größer als \(\mathit{pop}_{1}\) als \(\exp (0.146) = 1,157\) für männliche \(\mathit{pop}_{3}\), und für männliche Nachrichten an weibliche \(\mathit{pop}_{1}\) ist \(\exp (0,462) = 1,587\) für weibliche \(\mathit{pop}_{1}\) ebenfalls größer als \(\exp (0,141) = 1,151\) für weibliche \(\mathit{pop}_{3}\). Sowohl für Männer als auch für Frauen ist also das \(\mathit{pop}_{1}\) der anderen Partei wichtiger als das \(\mathit{pop}_{3}\). Außerdem stellen wir fest, dass, wenn Frauen Nachrichten an Männer senden, \(\exp (0.390) = 1.477\) für männliche \(\mathit{pop}_{1}\) geringer ist als \(\exp (0.462) = 1.587\) für weibliche \(\mathit{pop}_{1}\), wenn Männer Nachrichten an Frauen senden, was darauf hindeutet, dass im Vergleich zu Frauen bei Männern das \(\mathit{pop}_{1}\) der anderen Seite stärker mit ihrem Nachrichtenverhalten verbunden ist. Wenn jedoch Frauen Nachrichten an Männer senden, ist \(\exp (0.146) = 1.157\) für männliche \(\mathit{pop}_{3}\) größer als \(\exp (0.141) = 1.151) für weibliche \(\mathit{pop}_{3}\), wenn Männer Nachrichten an Frauen senden, was darauf hindeutet, dass bei Frauen im Vergleich zu Männern das \(\mathit{pop}_{3}\) der anderen Seite stärker mit ihrem Nachrichtenverhalten verbunden ist.

In China ist der Besitz einer Wohnung und eines Autos ein Symbol für den Reichtum und den sozialen Status einer Person, und in einigen Regionen sind sie zu einer Notwendigkeit geworden, um zu heiraten. Wenn Frauen ihren Männern Nachrichten schicken, ist es für die Männer wichtig, ein Haus und ein Auto zu haben. Wenn Männer Frauen Nachrichten schicken, ist es für Frauen nicht wichtig, ein Haus zu haben, aber es ist einigermaßen wichtig für Frauen, ein Auto zu haben. Wir stellen fest, dass \(\exp(0.038) = 1.039\) für die Frage, ob die andere Seite ein Auto hat, wenn Männer Nachrichten an Frauen senden, kleiner ist als \(\exp (0.157) = 1.170\) für die Frage, ob die andere Seite ein Auto hat, wenn Frauen Nachrichten an Männer senden, was darauf hindeutet, dass Frauen stärker darauf achten als Männer, ob die andere Seite ein Auto hat.

Der Outdegree eines Nutzers quantifiziert dessen Aktivität. Eine scheinbar hohe Aktivität bedeutet, dass er mit vielen anderen Nutzern in Kontakt steht, kann aber auch bedeuten, dass er mehr Zeit und Ressourcen in die Suche nach potenziellen Partnern investiert. Outdegree ist ein Attribut, das sich für Männer und Frauen unterscheidet. Wenn eine Frau einem Mann eine Nachricht schickt, ist der Outdegree der anderen Seite signifikant positiv mit dem Messaging-Verhalten verbunden, nicht aber, wenn ein Mann einer Frau eine Nachricht schickt. Wenn Frauen Nachrichten an Männer senden, sind Netzwerkmaße der Popularität und Aktivität der Männer, die sie kontaktieren, signifikant positiv mit ihrem Messaging-Verhalten assoziiert, aber wenn Männer Nachrichten an Frauen senden, sind nur die Netzwerkmaße der Popularität der Frauen, die sie kontaktieren, signifikant positiv mit ihrem Messaging-Verhalten assoziiert.

Ensemble-Learning-Klassifikation

Mit dem Aufkommen der Big-Data-Ära wurden Ensemble-Learning-Klassifikationsmethoden allmählich in den Bereich der sozialen Netzwerkforschung eingeführt. Bereits 1996 schlug Breiman die Methode des Bagging vor, und fünf Jahre später schlug er die Methode des Random Forest vor. Freund schlug 1997 die AdaBoost-Methode vor, und mit der kontinuierlichen Verbesserung von Klassifizierern des maschinellen Lernens schlugen Chen et al. 2016 einen Klassifizierer-XGBoost vor, der die Effizienz und Genauigkeit des Algorithmus in einigen Fällen erheblich verbessern kann. Kürzlich haben Reece et al. bereits maschinelle Lernverfahren angewandt, um Depressionen anhand von Instagram-Fotos zu identifizieren.

Die Regressionsanalyse stellt häufig bestimmte Anforderungen an die unabhängigen Variablen, wie z. B. das Fehlen von Multikollinearität. In diesem Abschnitt werden Ensemble-Learning-Klassifizierungsmethoden wie Bagging, Random Forest, AdaBoost und XGBoost verwendet, um die Bedeutung der einzelnen Attribute in Tabelle 1 zu bewerten. Wir verwenden das Paket „adabag“ in der R-Software, um AdaBoost- und Bagging-Methoden durchzuführen, das Paket „randomForest“, um die Random-Forest-Methode durchzuführen und das Paket „xgboost“, um die XGBoost-Methode durchzuführen. Für den Datensatz wird eine 5-fache Kreuzvalidierung verwendet, um die Leistung der Klassifikatoren zu bewerten, und die Parameter des Algorithmus werden so gewählt, dass eine stabile Fehlerquote erzielt wird. Die Anzahl der gesendeten und nicht gesendeten Nachrichten ist im Datensatz unausgewogen, und der größere Satz wird nach dem Zufallsprinzip unterteilt, um einen Satz mit der gleichen Größe wie der kleinere zu erhalten.

Die Fehlerraten der vier Klassifizierungsmethoden des Ensemble-Lernens sind in Tabelle 4 dargestellt. Wir stellen fest, dass die Fehlerraten von Random Forest und AdaBoost am niedrigsten sind, wenn Frauen Nachrichten an Männer senden, während XGBoost die niedrigsten Fehlerraten aufweist, wenn Männer Nachrichten an Frauen senden. Die Rangfolge der Wichtigkeit der Attribute ist in Abb. 9 und 10 dargestellt. Abbildung 9 zeigt, dass die drei wichtigsten Attribute, wenn Frauen Nachrichten an Männer senden, die Werte \(\mathit{pop}_{3}\) und \(\mathit{pop}_{1}\) für Männer und der Outdegree für Frauen sind. Ähnlich zeigt Abb. 10, dass die drei wichtigsten Attribute, wenn Männer Nachrichten an Frauen senden, die Werte \(\mathit{pop}_{3}\) und \(\mathit{pop}_{1}\) für Frauen und der Outdegree für Männer sind. Die wichtigsten Faktoren, die die Entscheidung zum Versenden von Nachrichten sowohl bei Männern als auch bei Frauen vorhersagen, sind die Werte \(\mathit{pop}_{3}\) und \(\mathit{pop}_{1}\), die die Beliebtheit potenzieller Partner repräsentieren und in der logistischen Regression ebenfalls signifikant positiv mit dem Messaging-Verhalten assoziiert sind.

Abbildung 9

Rangfolge der relativen Wichtigkeit von Attributen, wenn Frauen Nachrichten an Männer senden, für verschiedene Klassifizierungsmethoden. Die horizontale Achse zeigt die Attribute an und die vertikale Achse ihre entsprechende Bedeutung. Für Bagging, Random Forest und AdaBoost wird die relative Wichtigkeit jeder Variablen in der Klassifizierungsaufgabe durch den Gini-Index gemessen, und für XGBoost wird die relative Wichtigkeit durch den Gain-Parameter gemessen

Abbildung 10

Rangfolge der relativen Wichtigkeit von Attributen, wenn Männer Nachrichten an Frauen senden, für verschiedene Klassifizierungsmethoden. Die horizontale Achse gibt die Attribute an, die vertikale Achse ihre jeweilige Wichtigkeit. Für Bagging, Random Forest und AdaBoost wird die relative Wichtigkeit jeder Variablen in der Klassifizierungsaufgabe durch den Gini-Index gemessen, und für XGBoost wird die relative Wichtigkeit durch den Gain-Parameter gemessen

Tabelle 4 Fehlerquoten bei Klassifizierungsmethoden mit Ensemble-Learning

Der Zweck der Klassifizierung mit Ensemble-Learning unterscheidet sich von der logistischen Regressionsanalyse. Aus den Abbildungen 9 und 10 geht hervor, dass die Zentralitätsindizes in der Tat von überragender Bedeutung sind und die anderen Variablen eine relativ geringe Vorhersagekraft haben. Dies bedeutet jedoch nicht, dass die anderen Variablen nutzlos sind, und sie können immer noch signifikant mit dem Messaging-Verhalten der Nutzer in der logistischen Regression assoziiert werden.

Analyse des strategischen Verhaltens

Das Konzept des strategischen Verhaltens stammt aus den Wirtschaftswissenschaften, wo die ursprüngliche Implikation ist, dass Unternehmen Maßnahmen ergreifen, die das Marktumfeld beeinflussen, um den Gewinn zu steigern (in dieser Studie wird auf die Antwortrate auf Nachrichten verwiesen), was dann auf Matching-Probleme wie das Matching von Partnern ausgedehnt wird.

In unserer Forschung bezieht sich strategisches Verhalten darauf, ob ein Nutzer eine Nachricht an einen anderen Nutzer sendet, je nachdem, ob seine Entscheidung die Antwortwahrscheinlichkeit der Nachricht erhöhen kann. Da wir keine Antwortdaten von Nutzern haben, möchten wir Zentralitätsindizes verwenden, die die Nutzerpopularität charakterisieren, um zu analysieren, ob Nutzer dazu neigen, Nachrichten an Personen zu senden, die beliebter sind als sie selbst oder an solche, die weniger beliebt sind. Wir untersuchen das strategische Verhalten der Nutzer, indem wir die Korrelation zwischen den Zentralitätsindizes analysieren. Glättende Anpassungskurven für die Korrelation mit dem verallgemeinerten additiven Modell zeigen, dass es eine nichtlineare oder annähernd lineare Beziehung zwischen den Zentralitätsindizes der Nutzer gibt (siehe Abb. 5 und 6 in Zusatzdatei 1 für Details), daher verwenden wir den Spearman-Korrelationskoeffizienten, um die Korrelation zu charakterisieren. Wie aus den Tabellen 5 und 6 hervorgeht, zeigen Männer und Frauen auf der Dating-Website trotz der geringeren Kosten der Ablehnung in der Netzwerkumgebung unterschiedliche Verhaltensmuster bei der Nachrichtenübermittlung. Für Männer, die Nachrichten an Frauen senden, gibt es schwache positive Korrelationen zwischen den Zentralitätsindizes, die durch kleine positive und signifikante Korrelationskoeffizienten charakterisiert werden können, während für Frauen, die Nachrichten an Männer senden, schwache oder mäßige positive Korrelationen zwischen den Zentralitätsindizes bestehen, die durch kleine oder etwas größere positive und signifikante Korrelationskoeffizienten charakterisiert werden. Männer zeigen beim Versenden von Nachrichten nur wenig strategisches Verhalten, während bei Frauen mit steigendem Zentralitätsindex die entsprechenden Indizes der Männer, die ihre Nachrichten erhalten haben, ebenfalls steigen könnten.

Tabelle 5 Spearman-Korrelationskoeffizienten zwischen den Zentralitätsindizes, wenn Frauen Nachrichten an Männer senden
Tabelle 6 Spearman-Korrelationskoeffizienten zwischen den Zentralitätsindizes, wenn Männer Nachrichten an Frauen senden

Durch die Untersuchung der Korrelationen zwischen den gleichen Zentralitätsindexpaaren für die Nutzer, analysieren wir weiter, ob Nutzer dazu neigen, Nachrichten an Personen zu senden, die beliebter sind als sie selbst, oder an solche, die weniger beliebt sind. Für jeden Zentralitätsindex der Absender geben wir den Mittelwert und die Standardabweichung der entsprechenden Empfängerindizes sowie den Anteil der Zentralitätsindizes der Empfänger an, die größer sind als die der Absender (siehe Abb. 7 und 8 in Zusatzdatei 1). Tabelle 7 zeigt für jeden Zentralitätsindex den Anteil der Zentralitätsindizes der Empfänger, die beim Senden von Nachrichten größer sind als die der Sender. Zum Vergleich geben wir auch die Ergebnisse für die Zufallszahlen an. Im Vergleich zu Männern neigen mehr Frauen dazu, Nachrichten an Personen zu senden, die beliebter sind als sie selbst.

Tabelle 7 Die Anteile der Zentralitätsindizes der Empfänger, die beim Versenden von Nachrichten größer sind als die der Absender

Es gibt mehrere Studien über das strategische Verhalten der Nutzer beim Online-Dating. Einige Studien haben eine signifikante positive Korrelation zwischen der Popularität von männlichen und weiblichen Nutzern festgestellt. Die Untersuchung von Taylor et al. über Nutzer aus den USA hat beispielsweise gezeigt, dass sie dazu neigen, andere Nutzer auszuwählen und von ihnen ausgewählt zu werden, deren relative Beliebtheit der ihren ähnelt, obwohl dies nicht unbedingt eine höhere Erfolgsquote bedeutet, d. h. mehr Antworten zu erhalten. Eine kürzlich durchgeführte empirische Analyse von Nutzern einer Online-Dating-Website in vier US-Städten nutzte PageRank zur Charakterisierung ihrer Begehrlichkeit und stellte fest, dass sowohl Männer als auch Frauen Nachrichten an Partner schickten, die im Durchschnitt etwa 25 % begehrenswerter waren als sie selbst. Es gibt jedoch auch einige Studien, die keine Korrelation zwischen der Beliebtheit der Nutzer festgestellt haben. So erbrachte die Untersuchung von Nutzern in Boston und San Diego keine Hinweise auf strategisches Verhalten. Eine andere Untersuchung von Online-Dating-Daten aus einer mittelgroßen Stadt im Südwesten der USA ergab, dass sowohl Männer als auch Frauen unabhängig von ihrem eigenen Attraktivitätsgrad, der die physische Attraktivität, die Beliebtheit, die Freundlichkeit und die materiellen Ressourcen der Nutzer charakterisiert, dazu neigen, Nachrichten an die sozial begehrtesten Nutzer zu senden. Wir stellen fest, dass Nutzer auf verschiedenen Plattformen oder in verschiedenen kulturellen Kontexten unterschiedliche strategische Verhaltensweisen zeigen, und die zugrunde liegenden Mechanismen müssen noch weiter erforscht werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.