Attribut preferensanalys

Attribut skillnad fördelning

I online dejting, Det finns betydande könsskillnader när det gäller attribut preferens, självpresentation och interaktion. Användarna har vanligtvis en viss preferens för kompisarnas ålder eller längd. För både män och kvinnor, när de skickar meddelanden till sina potentiella partners, beräknar vi åldersskillnaden som ålder(mottagare) – ålder(avsändare), och höjdskillnaden som höjd(mottagare) – höjd(avsändare). Figurerna 1 och 2 visar fördelningen av åldersskillnader respektive höjdskillnader. Som en jämförelse visar vi också de slumpmässiga resultaten genom att anta att kvinnliga (manliga) användare slumpmässigt skickar meddelanden till manliga (kvinnliga) användare.

Figur 1

Aldersskillnadsfördelning. FM står för att kvinnliga användare skickar meddelanden till manliga användare och MF står för att manliga användare skickar meddelanden till kvinnliga användare. Heldragna linjer representerar den lokalt viktade polynomialregressionsanpassningen av motsvarande datapunkter, och det grå intervallet representerar en 95 % konfidensregion

Figur 2

Höjdskillnadsfördelning. FM står för att kvinnliga användare skickar meddelanden till manliga användare och MF för att manliga användare skickar meddelanden till kvinnliga användare. Heldragna linjer representerar den lokalt viktade polynomialregressionsanpassningen av motsvarande datapunkter, och det grå intervallet representerar en 95 % konfidensregion

I de flesta tider och på de flesta platser brukar kvinnor gifta sig med äldre män . Figur 1 visar att i det moderna kinesiska samhället föredrar män i genomsnitt kvinnor som är två år yngre än de själva och kvinnor föredrar män som är två år äldre än de själva. Kvinnor accepterar dock mindre åldersskillnader än män: Kvinnor accepterar minst att män är 11 år yngre än dem och högst att män är 23 år äldre än dem, medan män accepterar minst att kvinnor är 25 år yngre än dem och högst att kvinnor är 28 år äldre än dem. Om man endast tar hänsyn till fördelningen av åldersskillnaderna, i linje med tidigare resultat från en rad olika kulturer och religioner, finner man att det åldersintervall som kvinnor är villiga att skicka meddelanden är smalare än det åldersintervall som män är villiga att skicka meddelanden. Mäns och kvinnors preferenser är inte slumpmässiga; de söker potentiella dejter med en mindre åldersskillnad än vad som förutses av ett slumpmässigt urval, vilket visar på egenskapen likes-attract.

Figur 2 visar att generellt sett är höjdskillnaden för kvinnor som sänder meddelanden till män (de flesta är 12 cm) större än den för män som sänder meddelanden till kvinnor (de flesta är 10 cm) när de väljer potentiella kompisar. I Kina är den ideala höjdskillnaden för män att de är 10 cm längre än den person de meddelar, medan den ideala höjdskillnaden för kvinnor är att de är 12 cm kortare än den person de meddelar. Enligt uppgifter från Yahoos dejtingannonser spelar längden också roll för användarna i USA, särskilt för kvinnor. I fig. 2 är höjdskillnaden för kvinnor mindre än för män: den minsta höjd som kvinnor accepterar är att män är 3 cm kortare än dem och den högsta höjd som de accepterar är att män är 30 cm längre än dem, medan den minsta höjd som män accepterar är att kvinnor är 13 cm kortare än dem och den högsta höjd som de accepterar är att kvinnor är 32 cm längre än dem. Kvinnor uppvisar egenskapen ”gillar-attraherar” när det gäller preferens för längd. Precis som med ålder söker användarna potentiella partners med en mindre längdskillnad än vad som förutses genom slumpmässigt urval, även om skillnaden inte är lika uppenbar som åldersskillnaden.

Det är värt att notera att på dejtingsajten är användarnas egenskaper alla självrapporterade. För att hantera intrycket kan användarna överdriva sina personliga egenskaper. Till exempel visade en nyligen genomförd forskning om självrapporterad längd på nätet mot objektivt uppmätta data hos unga australiska vuxna att den självrapporterade längden överskattas signifikant med i genomsnitt 1,79 cm för män och 1,29 cm för kvinnor . Män ljuger mer än kvinnor om sin längd, vilket också konstateras bland online-datare i New York City . Vi noterar att användarna verkar inte ha rapporterat sin fysiska längd korrekt på dejtingsajten. I datasetet är den genomsnittliga längden för kvinnliga och manliga användare 161,99 cm (\(\mathit{SD}=4,18\)) respektive 173,08 cm (\(\mathit{SD}=4,68\)). I verkligheten är dock genomsnittslängden för vuxna kvinnor och män i Kina 160,88 cm respektive 169,00 cm, vilket innebär att kvinnliga och manliga användare kan överdriva sin längd med i genomsnitt 1,11 cm respektive 4,08 cm. Efter att ha korrigerat detta finner vi att de verkliga längdskillnaderna \(10-(4,08-1,11) = 7,03\text{ cm}\) för män och \(12-(4,08-1,11) = 9,03\text{ cm}\) för kvinnor skulle vara betydande. Men vi noterar också att genomsnittsåldern för manliga och kvinnliga användare på dejtingsajten är 28,73 respektive 28,58 år, medan genomsnittsåldern för män och kvinnor i den totala vuxna befolkningen i Kina är 40,56 respektive 41,01 år enligt folkräkningsdata. Datingpopulationen är yngre än den totala vuxna befolkningen och är därför sannolikt längre, och användarna kanske inte överdriver sin längd lika mycket som beräknat.

Attributpreferens

När en användare skickar ett meddelande till en annan användare är valet av mottagare kanske inte slumpmässigt, utan har snarare en viss preferens för vissa attribut, till exempel preferens för sysselsättning, utbildning, inkomst och så vidare. För att karakterisera preferensen hos avsändare med attribut i för mottagare med attribut j, låt \(m_{ij}\) vara antalet meddelanden som skickas från användare med attribut i till användare med attribut j, \(m_{i}\) är det totala antalet meddelanden som skickas från användare med attribut i, \(n_{j}\) är antalet mottagare med attribut j och n är det totala antalet mottagare, så är attributpreferensen \(p_{ij} = m_{ij} /m_{i} – n_{j} /n\). \(p_{ij}>0\) anger att avsändare med attribut i föredrar mottagare med attribut j jämfört med slumpmässigt urval, \(p_{ij}=0\) anger att det inte finns någon preferens och \(p_{ij}<0\) anger negativ preferens, dvs. att man föredrar att inte välja mottagare med attribut j.

Figurerna 3 och 4 visar preferenserna för varje anställning (se tabellerna 1 och 2 i tilläggsfil 1 för betydelsen av attributen och antalet och andelen män/kvinnor för varje anställning). Vi finner att jämfört med män som skickar meddelanden till kvinnor, när kvinnliga användare skickar meddelanden till manliga användare, finns det en starkare preferens för de anställningar som deras potentiella partner har. I figur 3 finner vi att kvinnor som är studenter, revisorer, utbildare eller i andra icke-kategoriserade yrken inte föredras av männen, medan kvinnor som sysslar med design är något populära när det gäller den relativa mängden mottagna meddelanden, särskilt för män inom flygbranschen. Samtidigt finner vi också att i dessa uppgifter skickar män som arbetar med hushållsarbete endast meddelanden till kvinnor som arbetar med redovisning och män som arbetar inom översättningsbranschen endast meddelanden till kvinnor som är privata ägare, vilket kan bero på att urvalet av användarnas beteende med avseende på dessa egenskaper är litet.

Figur 3

Arbetsförmåga för manliga användare som skickar meddelanden till kvinnliga användare. Den vertikala axeln anger de manliga yrkena och den horisontella axeln anger de kvinnliga yrkena. Preferensvärdena representeras av olika färger

Figur 4

Arbetsförmågaspreferens för kvinnliga användare som skickar meddelanden till manliga användare. Den vertikala axeln anger de kvinnliga yrkena och den horisontella axeln anger de manliga yrkena. Preferensvärdena representeras av olika färger

Från figur 4 finner vi att de mest populära yrkena för män är ledande befattningar, ekonomi, utbildning och privata ägare. De flesta personer inom dessa fyra yrken har hög inkomst eller är välutbildade. Opopulära manliga användare är skolelever, försäljare och personer med andra icke-kategoriserade yrken. Samtidigt tenderar kvinnor som arbetar inom kemisk industri att söka män som arbetar inom utbildning, kvinnor som arbetar inom sport tenderar att söka män som är privata ägare och kvinnor som arbetar inom polisen skickar endast meddelanden till män som arbetar inom finans och fastigheter i dessa uppgifter, vilket också kan tillskrivas det lilla urvalet av användarbeteende med avseende på dessa attribut.

Utbildningsnivåerna har en betydande inverkan på parning och äktenskap . Preferenser för utbildningsnivå visas i figurerna 5 och 6 (se tabellerna 3 och 4 i Additional file 1 för betydelsen av attributen och antalet och andelen män/kvinnor för varje utbildningsnivå). I Kina, liksom i de andra länderna, avser postdoktor också en position snarare än en utbildningsnivå. När en användare registrerar sig på många kinesiska webbplatser betraktas postdoktor dock också som en utbildningsnivå utöver doktorsexamen. På samma sätt finner vi att när kvinnliga användare skickar meddelanden till manliga användare, jämfört med när manliga användare skickar meddelanden till kvinnliga användare, finns det en starkare preferens för utbildningsnivån hos deras potentiella partner. Figur 5 visar att män vars utbildningsnivå är lägre än en kandidatexamen tenderar att leta efter kvinnor med samma akademiska kvalifikationer som de själva eller lägre än deras kvalifikationer, män med en utbildningsnivå som är högre än en kandidatexamen men lägre än en doktorsexamen tenderar att leta efter kvinnor med en kandidatexamen, och män med en doktorsexamen eller en postdoktoral utbildning tenderar att leta efter kvinnor med en examen. När det gäller preferenser för utbildningsnivåer uppvisar män generellt sett en ”likes-attract”-karaktär. När det gäller kvinnliga användare som skickar meddelanden till manliga användare visar fig. 6 att män med en grundexamen och en doktorsexamen är populära, och för de flesta kvinnor är män med en grundexamen mer populära, men kvinnor med en doktorsexamen är mer benägna att söka efter potentiella partner med en doktorsexamen. När det gäller preferenser för utbildningsnivåer uppvisar kvinnor i allmänhet potentiellt attraktiva egenskaper. Forskning på en tysk nätdejtingsajt visade att preferensen för liknande utbildningsbakgrund ökar med utbildningsnivån. Kvinnor är ovilliga att kommunicera med män med lägre utbildningsnivå, men det finns inga hinder för män att kontakta kvinnor med lägre utbildningsnivå.

Figur 5

Utbildningsnivåpreferens för manliga användare som skickar meddelanden till kvinnliga användare. Den vertikala axeln anger de manliga utbildningsnivåerna och den horisontella axeln anger de kvinnliga utbildningsnivåerna. Preferensvärdena representeras av olika färger

Figur 6

Utbildningsnivåpreferens för kvinnliga användare som skickar meddelanden till manliga användare. Den vertikala axeln anger de kvinnliga utbildningsnivåerna och den horisontella axeln anger de manliga utbildningsnivåerna. Preferensvärdena representeras av olika färger. Postdoktorala kvinnor skickade inga meddelanden till män i datasetet, och vi satte elementen i motsvarande rad till 0

Utbildningsnivå och inkomst är två viktiga indikatorer på en persons sociala och ekonomiska status. I figurerna 7 och 8 (se tabellerna 5 och 6 i tilläggsfil 1 för betydelsen av attributen och antalet och andelen män/kvinnor för varje inkomstnivå) finner vi att när det gäller inkomstnivåer finns det mindre uppenbara preferenser i fråga om val av potentiell partner för manliga användare jämfört med kvinnliga användare. Å ena sidan, som framgår av figur 7, föredrar alla män uppenbarligen kvinnor vars månadsinkomst ligger mellan 5 000 och 10 000 RMB (RMB är den kinesiska valutan och 1 RMB = 0,145 US-dollar = 0,128 euro), medan kvinnor vars inkomst ligger under 2 000 RMB uppenbarligen utesluts. Männen visar dock inga uppenbara preferenser eller uteslutningar för kvinnor med en inkomst på över 10 000 RMB. Å andra sidan, som framgår av figur 8, ogillar alla kvinnor män som tjänar mindre än 5 000 RMB, och män som tjänar mellan 10 000 och 20 000 RMB är de mest populära. När det gäller preferenser för inkomstnivåer uppvisar kvinnor i allmänhet också potentiell-attraktiv egenskap. Ett fältexperiment på en kinesisk nätdejtingsajt visade att männen besökte profiler från kvinnor med olika inkomster i ungefär samma utsträckning, medan för kvinnor gäller att ju högre männens inkomster är, desto större är andelen som besöker deras profiler , vilket skiljer sig från våra resultat.

Figur 7

Preferens för månadsinkomstnivåer för manliga användare som skickar meddelanden till kvinnliga användare. Den vertikala axeln anger de manliga inkomstnivåerna och den horisontella axeln anger de kvinnliga inkomstnivåerna. Preferensvärdena representeras av olika färger

Figur 8

Preferens för månatliga inkomstnivåer för kvinnliga användare som skickar meddelanden till manliga användare. Den vertikala axeln anger de kvinnliga inkomstnivåerna och den horisontella axeln anger de manliga inkomstnivåerna. Preferensvärden representeras av olika färger

Logistisk regressionsklassificering

Kompatibilitetspoäng

På användarnas personliga hemsidor har varje användare visat sina krav på de potentiella partnerna, inklusive krav på 7 attribut, dvs.dvs. ålder, avatar, utbildningsnivå, längd, kreditvärdighet, bostadsort och civilstånd (se figur 1-4 i tilläggsfil 1 för urvalskraven för flera attribut). När det gäller kreditvärdighet får en användare på dejtingsajten den första stjärnan, dvs. kreditvärdigheten är lika med 1, när han eller hon har klarat den snabba identitetsverifieringen på dejtingsajten eller laddat upp ett av tre dokument (ID-kortet, passet eller Hong Kong- och Macau-passet) och klarat granskningen. På grundval av den första stjärnan kan varje gång ett nytt dokument laddas upp och godkänns ytterligare en stjärna eller ett betyg läggas till (upp till fem stjärnor, dvs. femstjärnig medlem). Även om användarnas minimiålder på plattformen är 18 år är det fortfarande mycket få användare som ställer krav på lägsta eller högsta ålder under 18 år (se figur 3 i tilläggsfil 1 för mer information). Vi använder begreppet kompatibilitetspoäng för att beskriva matchningen mellan användare utifrån om en användare uppfyller en annan användares urvalskrav eller inte. När kvinnor skickar meddelanden till män kan vi för varje meddelande och för varje attribut få fram andelen kvinnor som matchar männens partnerpreferenser och andelen män som matchar kvinnornas preferenser, dvs. vi kan få fram två vektorer med sju proportioner. Enligt uppgifterna får vi \(\mathbf{w}_{\mathrm{FMm}}= (0.701,0.886,0.462,0.826,0.919,0.786,0.920)\), och \(\mathbf{w}_{\mathrm{FMf}}=(0.912,0.976,0.681,0.962,0.994,0.864,0.912)\), där \(\(\mathbf{w}_{\mathrm{FMm}}\) är andelen kvinnliga attribut som överensstämmer med manliga preferenser och \(\(\mathbf{w}_{\mathrm{FMf}}}\) är andelen manliga attribut som överensstämmer med kvinnliga preferenser. På samma sätt får vi \(\mathbf{w}_{\mathrm{MFm}}=(0.877,0.977,0.402,0.980,0.992,0.831,0.960)\) and \(\mathbf{w}_{\mathrm{MFf}}=(0.671,0.867,0.572,0.678,0.758,0.771,0.892)\). Således är kompatibilitetspoängen för kvinnor som skickar meddelanden till män

$$\begin{aligned}& c_{\mathrm{FMm}} = \frac{\mathbf{w}_{\mathrm{FMm}} \cdot { (\textrm{female attr. in male pref.})}}}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{FMm}} )}}, \end{aligned}}$$$
(1)

$$\begin{aligned}& c_{\mathrm{FMf}}} = \frac{\mathbf{w}_{\mathrm{FMf}} \cdot (\textrm{manlig attr. i kvinnlig pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{FMf}} )}}, \end{aligned}$$$
(2)

och kompatibilitetspoängen för män som skickar meddelanden till kvinnor är

$$\\begin{aligned}& c_{\mathrm{MFm}} = \frac{\mathbf{w}_{\mathrm{MFm}} \cdot (\textrm{female attr. in male pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{MFm}} )}}, \end{aligned}}$$$
(3)

$$\begin{aligned}& c_{\mathrm{MFff}} = \frac{\mathbf{w}_{\mathrm{MFf}} \cdot (\textrm{manlig attr. i kvinnlig pref. })}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{MFff}} )}}, \end{aligned}}$$$
(4)

där (kvinnlig attr. i manlig pref.) är en vektor som anger om kvinnliga attribut uppfyller manliga preferenser för ett par användare (1 för ja och 0 för nej), och på samma sätt är (male attr. in female pref.) en vektor som anger om manliga attribut uppfyller kvinnliga preferenser för ett par användare. Ekvationerna 1 och 3 är kompatibilitetspoängen mellan en manlig preferens och profilen för hans valda partner, och ekvationerna 2 och 4 är kompatibilitetspoängen mellan en kvinnlig preferens och profilen för hennes valda partner. För ett par användare, \(u_{a}\) och \(u_{b}\), använder vi en poäng, dvs. en reciprok poäng, för att kvantifiera hur mycket attributen hos \(u_{b}\) stämmer överens med preferenserna hos \(u_{a}\) och hur mycket attributen hos \(u_{a}\) stämmer överens med preferenserna hos \(u_{b}\). Den ömsesidiga poängen mellan \(u_{a}\) och \(u_{b}\) är medelvärdet av dessa två användares kompatibilitetspoäng, dvs, För kvinnor som skickar meddelanden till män är den ömsesidiga poängen \(\mathit{rs}} = (c_{\mathrm {FMm}} + c_{\mathrm{FMf}} )/2\), och för män som skickar meddelanden till kvinnor \(\mathit{rs} = (c_{\mathrm{MFm}} + c_{\mathrm{MFf}} )/2\).

Logistisk regression

Låt click vara antalet gånger en användare klickas, msg vara antalet meddelanden som en användare tar emot och rec vara antalet gånger en användare rekommenderas och visas på andra användares hemsidor, definierar vi \(\mathit{pop}_{1} = \mathit{click}/\mathit{rec}\) och \(\mathit{pop}_{2} = \mathit{msg}/\mathit{rec}\) som kan karakterisera en användares popularitet baserat på handlingar. Vi använder också PageRank-centralitet (\(\mathit{pop}_{3}\)) för att kvantifiera hur central eller populär en användare är i ett nätverk genom att ta hänsyn till alla anslutningar i nätverket. Attraktiva människor, t.ex. människor med fördelaktiga demografiska attribut och högre socioekonomisk status, tenderar att vara mer krävande än genomsnittliga människor när det gäller potentiella partnerval, vilket kan avslöjas i preferensanalysen av inkomst och utbildningsnivå i avsnitt 2.2. 3.1.2. De som uppfattas som attraktiva av attraktiva människor kan bli ännu mer populära/attraktiva. De variabler som används i uppsatsen och deras betydelser framgår av tabell 1.

Tabell 1 Variabler och deras motsvarande betydelser

Vi introducerar flera centralitetsindex, såsom \(\mathit{pop}_{1}\), \(\mathit{pop}_{2}\), \(\mathit{pop}_{2}\), \(\mathit{pop}_{3}\) och indegree, för att utvärdera deras korrelation med meddelandebeteenden. Det är värt att notera att centralitetsindexen är aggregerade indikatorer som beskriver användarnas önskvärdhet eller popularitet, och användarna känner inte till sina index och inte heller till andras index. Vi använder outdegree för att beskriva användarnas aktivitetsnivå, och på dejtingsajten känner användarna inte heller till andra användares outdegree. I stället för att använda index för att identifiera eller välja ut attraktiva partners kommer användarna att skicka meddelanden till varandra på grundval av mer specifika ledtrådar, t.ex. högre inkomst, bättre utbildningsbakgrund, attraktiva foton eller god demografisk och socioekonomisk kompatibilitet. I uppsatsen kommer vi att utvärdera om indexen är signifikant förknippade med meddelandebeteenden.

Antag att \(p_{i}\) är sannolikheten att skicka meddelanden för en kvinnlig användare i, \(1-p_{i}\) är sannolikheten att inte skicka meddelanden, då \(L_{f_{i}}=\ln(\frac{p_{i}}}{1-p_{i}})\), dvs, för alla kvinnor, \(L_{f}=\ln(\frac{p}{1-p})\). På samma sätt, anta att \(q_{j}\) är sannolikheten att skicka meddelanden för en manlig användare i, \(1-q_{j}\) är sannolikheten att inte skicka meddelanden, då \(L_{m_{j}}}=\ln (\frac{q_{j}}}{1-q_{j}})\), dvs, för alla män, \(L_{m}= \ln(\frac{q}{1-q})\). Vi får logistiska regressionsmodeller enligt följande:

$$\begin{aligned}& L_{f} = \alpha _{1} + {\boldsymbol{\beta} }_{1} \cdot {\mathbf{attribute}} + \varepsilon _{\mathrm{1}}}, \end{aligned}}$$$
(5)

$$\begin{aligned}& L_{m} = \alpha _{2} + {\boldsymbol{\beta }}_{2} \cdot {\mathbf{attribute}} + \varepsilon _{\mathrm{2}}. \end{aligned}$$$
(6)

I den här studien utförs multikollinearitetstester för att hitta oberoende variabler bland vilka korrelationskoefficienterna är mindre än 0,5 (se tabellerna 7 och 8 i tilläggsfil 1 för detaljer). Resultaten av den logistiska regressionen för kvinnor som skickar meddelanden till män visas i tabell 2. Vi finner att nästan alla variabler är signifikanta när man endast tar hänsyn till kvinnornas egenskaper (modell 1), dvs. avsändarnas egenskaper, men endast kvinnornas bostadsnivå och övergrad är positivt förknippade med sannolikheten för att kvinnor skickar meddelanden till män. När man endast beaktar männens attribut (modell 2) är alla andra attribut signifikanta och har ett positivt samband med sannolikheten att kvinnor skickar meddelanden, med undantag för verifiering av mobiltelefonen och kreditvärdighet för män. När man tar hänsyn till de två parternas attribut och kompatibilitetsvärden (modell 3) är bland de signifikanta variablerna kvinnlig mobiltelefonverifiering, bilägande, kreditvärdighet och popularitetsnivåer (\(\mathit{pop}_{1}\) och \(\(\mathit{pop}_{3}\))) negativt förknippade med sannolikheten för att kvinnor ska skicka meddelanden, medan de andra variablerna är positivt förknippade. Vi finner att när kvinnor skickar meddelanden till män är de inte bara bekymrade över om de uppfyller männens krav utan också om männen uppfyller deras egna krav.

Tabell 2 Logistiska regressionsresultat för kvinnliga användare som skickar meddelanden till manliga användare

De logistiska regressionsresultaten för män som skickar meddelanden till kvinnor visas i tabell 3. Vi finner att när endast de kvinnliga attributen beaktas (modell 1) är alla andra variabler signifikanta, med undantag för kvinnlig mobiltelefonsverifiering, kreditvärdighet och outdegree, men endast kvinnligt husägande påverkar sannolikheten för att män skickar meddelanden på ett negativt sätt. När endast manliga attribut beaktas (modell 2) är alla variabler signifikanta, men endast manlig outdegree är positivt korrelerad med meddelandebeteende, medan andra är negativt korrelerade. När alla variabler beaktas (modell 3) är alla andra variabler signifikanta, med undantag för kvinnlig kreditvärdighet, outdegree och kompatibilitetspoängen mellan en kvinnlig preferens och profilen för motsvarande andra sida, alla andra variabler är signifikanta. Bland de signifikanta variablerna är kvinnlig mobiltelefonverifiering, bilägande, popularitet (\(\mathit{pop}_{1}\), \(\mathit{pop}_{2}\) och \(\mathit{pop}_{3}\)), manlig outdegree och kompatibilitetspoängen mellan en manlig preferens och profilen för den motsvarande andra sidan positivt korrelerade med meddelandebeteende, medan alla andra variabler är negativt korrelerade. Genom att analysera betydelsen av de två kompatibilitetspoängen finner vi dessutom att männen endast uppmärksammar om kvinnorna uppfyller deras egna krav när de skickar meddelanden till kvinnor.

Tabell 3 Resultat av logistisk regression för manliga användare som skickar meddelanden till kvinnliga användare

Som framgår av tabellerna 2 och 3, för män eller kvinnor som skickar meddelanden, är den andra sidans popularitet signifikant positivt associerad med meddelandebeteenden. Å ena sidan representerar \(\mathit{pop}_{1}\) och \(\mathit{pop}_{2}\) värden, enligt deras beräkningsmetod, en användares lokala popularitet. Å andra sidan representerar värdet \(\mathit{pop}_{3}\), dvs. PageRank, en användares popularitet ur ett globalt perspektiv.

För kvinnor som skickar meddelanden till män är \(\exp (0.390) = 1.477\) för manliga \(\mathit{pop}_{1}\) större än \(\exp (0.146) = 1.157\) för manliga \(\mathit{pop}_{3}\), och för män som skickar meddelanden till kvinnor är \(\exp (0.462) = 1.587\) för kvinnliga \(\mathit{pop}_{1}\) också större än \(\exp (0.141) = 1.151\) för kvinnliga \(\mathit{pop}_{3}\). För både män och kvinnor är alltså den andra partens \(\mathit{pop}_{1}\) viktigare än \(\mathit{pop}_{3}\). Dessutom finner vi också att när kvinnor skickar meddelanden till män är \(\exp (0,390) = 1,477\) för männens \(\mathit{pop}_{1}\) mindre än \(\exp (0,462) = 1.587\) för kvinnlig \(\mathit{pop}_{1}\) när män skickar meddelanden till kvinnor, vilket tyder på att jämfört med kvinnor är den andra sidans \(\mathit{pop}_{1}\) för män mer förknippad med deras meddelandebeteende. När kvinnor skickar meddelanden till män är \(\exp (0,146) = 1,157\) för manlig \(\mathit{pop}_{3}\) större än \(\exp (0,141) = 1,157\) för manlig \(\mathit{pop}_{3}\).151\) för kvinnlig \(\mathit{pop}_{3}\) när män skickar meddelanden till kvinnor, vilket tyder på att jämfört med män är den andra sidans \(\mathit{pop}_{3}\) för kvinnor mer förknippad med deras meddelandebeteende.

I Kina är det att ha en lägenhet och en bil en symbol för en persons rikedom och sociala status, och i vissa regioner har de blivit nödvändigheter för att gifta sig. När kvinnor skickar meddelanden till män är det viktigt att männen har en bostad och en bil. När män skickar meddelanden till kvinnor är det inte viktigt för kvinnor att ha ett hus men det är något viktigt för kvinnor att ha en bil. Vi finner att \(\exp(0,038) = 1,039\) för huruvida den andra sidan har en bil när män skickar meddelanden till kvinnor är mindre än \(\exp(0,157) = 1,170\) för huruvida den andra sidan har en bil när kvinnor skickar meddelanden till män, vilket tyder på att kvinnor ägnar större uppmärksamhet än män åt huruvida den andra sidan har en bil.

En användares outdegree kvantifierar användarens aktivitet. Till synes hög aktivitet innebär att man kontaktar många andra användare, men i huvudsak kan det innebära att användarna investerar mer tid och resurser i försöken att hitta potentiella partners. Outdegree är ett attribut som skiljer sig åt mellan män och kvinnor. När en kvinna skickar ett meddelande till en man är den andra sidans outdegree signifikant positivt förknippad med meddelandebeteendet, men inte när en man skickar ett meddelande till en kvinna. När kvinnor skickar meddelanden till män är nätverksmått för popularitet och aktivitet hos de män de kontaktar signifikant positivt förknippade med deras meddelandebeteende, men när män skickar meddelanden till kvinnor är endast nätverksmått för popularitet hos de kvinnor de kontaktar signifikant positivt förknippade med deras meddelandebeteende.

Ensemble learning classification

Med tillkomsten av big data-eran har klassificeringsmetoder för ensembleinlärning successivt introducerats inom området för forskning om sociala nätverk. Redan 1996 föreslog Breiman metoden bagging , och fem år senare föreslog han ytterligare metoden Random Forest . Freund föreslog AdaBoost-metoden 1997 , och med den kontinuerliga förbättringen av klassificerare för maskininlärning föreslog Chen et al. 2016 en klassificerare-XGBoost , som i vissa fall avsevärt kan förbättra algoritmens effektivitet och noggrannhet. Som en tillämpning har nyligen Reece et al. redan tillämpat verktyg för maskininlärning för att identifiera depression från Instagramfoton .

Regressionsanalys har ofta vissa krav på de oberoende variablerna, t.ex. avsaknad av multikollinearitet, men klassificeringsmetoder med ensembleinlärning lättar på begränsningarna för de oberoende variablerna. I det här avsnittet används klassificeringsmetoder för ensembleinlärning, inklusive bagging, Random Forest, AdaBoost och XGBoost, för att utvärdera betydelsen av varje attribut i tabell 1. Vi använder paketet ”adabag” i R-programvaran för att utföra AdaBoost- och baggingmetoderna, paketet ”randomForest” för att utföra Random Forest-metoden och paketet ”xgboost” för att utföra XGBoost-metoden. För datasetet används 5-faldig korsvalidering för att bedöma klassificerarnas prestanda, och algoritmparametrarna väljs för att uppnå en stabil felprocent. Antalet meddelanden som skickas och inte skickas är obalanserat i datasetet, och den större uppsättningen delas slumpmässigt ut för att få en uppsättning av samma storlek som den mindre.

Felprocenterna för fyra klassificeringsmetoder med ensembleinlärning visas i tabell 4. Vi finner att felprocenten för Random Forest och AdaBoost är lägst för kvinnor som skickar meddelanden till män medan XGBoost är lägst för män som skickar meddelanden till kvinnor. Rangordningen av attributens betydelse visas i figurerna 9 och 10. Figur 9 visar att när kvinnor skickar meddelanden till män är de tre viktigaste attributen \(\mathit{pop}_{3}\) och \(\mathit{pop}_{1}\) värdena för män och outdegree för kvinnor. På samma sätt visar figur 10 att när män skickar meddelanden till kvinnor är de tre viktigaste attributen \(\mathit{pop}_{3}\) och \(\mathit{pop}_{1}\) värdena för kvinnor och outdegree för män. De viktigaste faktorerna som förutsäger beslutet att skicka meddelanden för både män och kvinnor är värdena \(\mathit{pop}_{3}\) och \(\mathit{pop}_{1}\) som representerar de potentiella parternas popularitet, vilka också är signifikant positivt förknippade med meddelandebeteenden i den logistiska regressionen.

Figur 9

Attributens relativa betydelseranking när kvinnor skickar meddelanden till män för olika klassificeringsmetoder. Den horisontella axeln anger attributen och den vertikala axeln anger deras betydelse. För bagging, Random Forest och AdaBoost mäts den relativa betydelsen av varje variabel i klassificeringsuppgiften med Gini-indexet, och för XGBoost mäts den relativa betydelsen med Gain-parametern

Figur 10

Ranking av den relativa betydelsen av attributen när män skickar meddelanden till kvinnor för olika klassificeringsmetoder. Den horisontella axeln anger attributen och den vertikala axeln anger deras motsvarande betydelse. För bagging, Random Forest och AdaBoost mäts den relativa betydelsen av varje variabel i klassificeringsuppgiften med Gini-indexet, och för XGBoost mäts den relativa betydelsen med Gain-parametern

Tabell 4 Felprocent med hjälp av klassificeringsmetoder med ensembleinlärning

Syftet med klassificering med ensembleinlärning är annorlunda än logistisk regressionsanalys. Enligt figurerna 9 och 10 visar centralitetsindexen verkligen den överväldigande betydelsen, och de andra variablerna visar den relativa bristen på förutsägelseförmåga. Detta betyder dock inte att de andra variablerna är värdelösa, och de kan fortfarande vara signifikant förknippade med användarnas meddelandebeteende i logistisk regression.

Analys av strategiskt beteende

Begreppet strategiskt beteende härstammar från ekonomi, där den ursprungliga innebörden är att företag vidtar åtgärder som påverkar marknadsmiljön för att öka vinsten (vilket hänvisar till svarsfrekvensen för meddelanden i den här studien), vilket sedan utökas till matchningsproblem , som till exempel matchning av partner.

I vår forskning avser strategiskt beteende huruvida en användare kommer att skicka ett meddelande till en annan användare beror på om hans/hennes beslut kan öka svarssannolikheten för meddelandet. Eftersom vi saknar uppgifter om användarsvar vill vi använda centralitetsindex som karakteriserar användarens popularitet för att analysera om användarna tenderar att skicka meddelanden till personer som är mer populära än de själva eller till dem som är mindre populära. Vi studerar användarnas strategiska beteende genom att analysera korrelationen mellan centralitetsindex. Utjämnande anpassningskurvor för korrelationen med en generaliserad additiv modell visar att det finns ett icke-linjärt eller ungefärligt linjärt förhållande mellan användarnas centralitetsindex (se fig. 5 och 6 i Additional file 1 för detaljer), och därför använder vi Spearmans korrelationskoefficient för att karakterisera korrelationen. Som framgår av tabellerna 5 och 6 finner vi att på dejtingsajten visar män och kvinnor olika beteendemönster i meddelanden trots den minskade kostnaden för avvisningar i nätverksmiljön. För män som skickar meddelanden till kvinnor finns det svaga positiva korrelationer mellan centralitetsindex, som kan karakteriseras av små positiva och signifikanta korrelationskoefficienter, medan det för kvinnor som skickar meddelanden till män finns svaga eller blygsamma positiva korrelationer mellan centralitetsindex som karakteriseras av små eller något större positiva och signifikanta korrelationskoefficienter. Män uppvisar inte strategiskt beteende i någon större utsträckning när de skickar meddelanden, medan för kvinnor, när deras centralitetsindex ökar, motsvarande index för de män som mottagit deras meddelanden också kan öka.

Tabell 5 Spearmankorrelationskoefficienter mellan centralitetsindex när kvinnor skickar meddelanden till män
Tabell 6 Spearmankorrelationskoefficienter mellan centralitetsindex när män skickar meddelanden till kvinnor

Vid att studera korrelationerna mellan samma centralitetsindexpar för användare, analyserar vi vidare om användarna tenderar att skicka meddelanden till personer som är mer populära än de själva eller till personer som är mindre populära. För varje centralitetsindex för avsändare anger vi medelvärde och standardavvikelse för motsvarande mottagares index och andelen av mottagarnas centralitetsindex som är större än avsändarnas i figurerna 7 och 8 i tilläggsfil 1. För varje centralitetsindex presenteras i tabell 7 andelen av mottagarnas centralitetsindex som är större än avsändarnas när meddelanden skickas. Som en jämförelse ger vi också de slumpmässiga resultaten. Jämfört med män tenderar fler kvinnor att skicka meddelanden till personer som är mer populära än de själva.

Tabell 7 Andelarna av mottagarnas centralitetsindex som är större än avsändarnas när de skickar meddelanden

Det har gjorts flera studier om användarnas strategiska beteende vid nätdejting. Vissa studier har funnit en signifikant positiv korrelation mellan manliga och kvinnliga användares popularitet. Till exempel visade Taylor et al:s forskning om användare från USA att de tenderar att välja och bli valda av andra användare vars relativa popularitet liknar deras egen, även om det inte nödvändigtvis innebär en högre framgång, dvs. att de får fler svar . I en nyligen genomförd empirisk analys av användare i fyra amerikanska städer från en nätdejtingsajt användes PageRank för att karakterisera deras önskvärdhet, och man fann att både män och kvinnor skickade meddelanden till partners som i genomsnitt var 25 % mer önskvärda än de själva . Det finns dock även vissa studier som inte har funnit något samband mellan användarnas popularitet. Till exempel har forskningen om användare i Boston och San Diego inte visat på något strategiskt beteende. En annan forskning om nätdejtingdata från en medelstor sydvästlig stad i USA visade att både män och kvinnor tenderar att skicka meddelanden till de socialt mest eftertraktade användarna, oberoende av deras egna önskelighetsnivåer som karakteriserar användarnas fysiska attraktivitet, popularitet, personlighet och materiella resurser . Vi finner att användare på olika plattformar eller i olika kulturella sammanhang har olika strategiska beteenden, och de underliggande mekanismerna behöver fortfarande utforskas ytterligare.

Lämna ett svar

Din e-postadress kommer inte publiceras.