Attribuutti mieltymys analyysi

Attribuutti ero jakauma

In online dating, on merkittäviä sukupuolten välisiä eroavaisuuksia suhteen attribuutti mieltymys, itse- ja vuorovaikutus . Käyttäjillä on yleensä tietty mieltymys kumppanien ikään tai pituuteen. Kun miehet ja naiset lähettävät viestejä potentiaalisille kumppaneilleen, laskemme ikäeron ikänä(vastaanottaja) – ikä(lähettäjä) ja pituuseron pituutena(vastaanottaja) – pituus(lähettäjä). Kuvissa 1 ja 2 esitetään ikäeron ja pituuseron jakaumat. Vertailun vuoksi näytämme myös satunnaistetut tulokset olettamalla, että nais(mies)käyttäjät lähettävät satunnaisesti viestejä mies(nais)käyttäjille.

Kuvio 1

Aikaerojakauma. FM tarkoittaa, että naispuoliset käyttäjät lähettävät viestejä miespuolisille käyttäjille ja MF tarkoittaa, että miespuoliset käyttäjät lähettävät viestejä naispuolisille käyttäjille. Yhtenäiset viivat edustavat niitä vastaavien datapisteiden paikallisesti painotettua polynomiregressiosovitusta, ja harmaa väli edustaa 95 prosentin luottamusaluetta

Kuvio 2

Korkeuserojako. FM tarkoittaa, että naispuoliset käyttäjät lähettävät viestejä miespuolisille käyttäjille ja MF tarkoittaa, että miespuoliset käyttäjät lähettävät viestejä naispuolisille käyttäjille. Yhtenäiset viivat edustavat vastaavien datapisteiden paikallisesti painotettua polynomiregressiosovitusta, ja harmaa väli edustaa 95 %:n luottamusaluetta

Useimpina aikoina ja useimmissa paikoissa naiset menevät yleensä naimisiin vanhempien miesten kanssa . Kuvio 1 osoittaa, että nykyaikaisessa kiinalaisessa yhteiskunnassa miehet haluavat keskimäärin kaksi vuotta nuorempia naisia ja naiset kaksi vuotta vanhempia miehiä. Naisten hyväksymien ikäerojen vaihteluväli on kuitenkin pienempi kuin miesten: naiset hyväksyvät vähintään 11 vuotta nuoremmat miehet ja enintään 23 vuotta vanhemmat miehet, kun taas miehet hyväksyvät vähintään 25 vuotta nuoremmat naiset ja enintään 28 vuotta vanhemmat naiset. Jos tarkastellaan vain ikäerojakaumia, havaitaan eri kulttuureista ja uskonnoista saatujen aiempien havaintojen mukaisesti, että ikähaarukka, jonka naiset ovat valmiita lähettämään viestejä, on kapeampi kuin ikähaarukka, jonka miehet ovat valmiita lähettämään viestejä. Miesten ja naisten mieltymykset eivät ole satunnaisia; he etsivät potentiaalisia treffikumppaneita, joiden ikäero on pienempi kuin satunnaisvalinnan ennustama, mikä osoittaa tykkää-vetää-ominaisuuden.

Kuvasta 2 nähdään, että yleisesti ottaen miehille viestejä lähettävien naisten pituusero (suurin osa 12 cm) on suurempi kuin naisille viestejä lähettävien miesten pituusero (suurin osa 10 cm), kun he valitsevat potentiaalisia kumppaneita. Kiinassa miesten ihanteellinen pituusero on, että he ovat 10 cm pidempiä kuin viestin lähettäjä, kun taas naisten ihanteellinen pituusero on, että he ovat 12 cm lyhyempiä kuin viestin lähettäjä. Yahoo! -deittipalvelun henkilökohtaisista ilmoituksista saatujen tietojen mukaan myös yhdysvaltalaisille käyttäjille pituudella on merkitystä deittailussa, erityisesti naisille . Kuviossa 2 naisten pituusero on pienempi kuin miesten: naiset hyväksyvät vähintään sen, että miehet ovat 3 cm lyhyempiä kuin he ja enintään sen, että miehet ovat 30 cm pidempiä kuin he, kun taas miehet hyväksyvät vähintään sen, että naiset ovat 13 cm lyhyempiä kuin he ja enintään sen, että naiset ovat 32 cm pidempiä kuin he. Naiset osoittavat pituutta koskevan mieltymyksen osalta tykkää-vetää-ominaisuutta. Samoin kuin iän kanssa, käyttäjät etsivät potentiaalisia kumppaneita, joiden pituusero on pienempi kuin satunnaisvalinnan ennustama, vaikka ero ei olekaan yhtä selvä kuin ikäero.

On huomionarvoista, että deittisivustolla käyttäjien ominaisuudet ovat kaikki itse ilmoitettuja. Vaikutelman hallinnan vuoksi käyttäjät voivat liioitella henkilökohtaisia ominaisuuksiaan . Esimerkiksi äskettäinen tutkimus verkossa itse ilmoitetusta pituudesta verrattuna objektiivisesti mitattuihin tietoihin nuorilla australialaisilla aikuisilla paljasti, että itse ilmoitettu pituus on huomattavasti yliarvioitu keskimäärin 1,79 cm miehillä ja 1,29 cm naisilla . Miehet valehtelevat pituudestaan enemmän kuin naiset, mikä on havaittu myös newyorkilaisissa nettideittailijoissa . Huomaamme, että käyttäjät eivät näytä ilmoittaneen fyysistä pituuttaan tarkasti deittisivustolla. Aineistossa nais- ja mieskäyttäjien keskipituus on 161,99 cm (\(\mathit{SD}=4,18\)) ja 173,08 cm (\(\mathit{SD}=4,68\)). Todellisessa maailmassa aikuisten naisten ja miesten keskipituus Kiinassa on kuitenkin 160,88 cm ja 169,00 cm, mikä tarkoittaa, että nais- ja mieskäyttäjät voivat liioitella pituuttaan keskimäärin 1,11 cm ja 4,08 cm. Kun nämä on korjattu, todelliset pituuserot \(10-(4.08-1.11) = 7.03\text{ cm}\) miehillä ja \(12-(4.08-1.11) = 9.03\text{ cm}\) naisilla olisivat merkittäviä. Huomaamme kuitenkin myös, että deittisivuston mies- ja naiskäyttäjien keski-ikä on 28,73 ja 28,58 vuotta, kun taas Kiinan koko aikuisväestössä miesten keski-ikä on 40,56 ja naisten keski-ikä 41,01 vuotta väestölaskentatietojen mukaan. Deittiväestö on nuorempaa kuin koko aikuisväestö, joten se on todennäköisesti pitempi, eivätkä käyttäjät välttämättä liioittele pituuttaan aivan niin paljon kuin on laskettu.

Attribuuttipreferenssi

Kun käyttäjä lähettää viestin toiselle käyttäjälle, hänen vastaanottajavalintansa ei välttämättä ole sattumanvarainen, vaan hänellä on pikemminkin jonkinlainen mieltymys tiettyihin attribuutteihin, kuten esimerkiksi mieltymys työpaikkaan, koulutukseen, tuloihin ja niin edelleen. Ominaisuuden i omaavan lähettäjän mieltymystä ominaisuuden j omaavaan vastaanottajaan kuvaillaan siten, että \(m_{ij}\) on niiden viestien lukumäärä, jotka ominaisuuden i omaavat käyttäjät ovat lähettäneet ominaisuuden j omaaville käyttäjille, \(m_{i}\) on niiden viestien kokonaismäärä, jotka on lähetetty käyttäjiltä, joilla on ominaisuus i, \(n_{j}\) on niiden vastaanottajien määrä, joilla on ominaisuus j, ja n on vastaanottajien kokonaismäärä, jolloin attribuuttipreferenssi on \(p_{ij} = m_{ij} /m_{i} – n_{j} /n\). \(p_{ij}>0\) tarkoittaa, että satunnaisvalintaan verrattuna attribuutin i omaavilla lähettäjillä on preferenssi attribuutin j omaaviin vastaanottajiin nähden, \(p_{ij}=0\) tarkoittaa, että preferenssiä ei ole, ja \(p_{ij}<0\) tarkoittaa negatiivista preferenssiä, ts. ettei mieluummin valita vastaanottajia, joilla on attribuutti j.

Työpaikkapreferenssit on esitetty kuvissa 3 ja 4 (attribuuttien merkitykset ja miesten/naisten määrä ja osuus kussakin työtehtävässä on esitetty lisätiedoston 1 taulukoissa 1 ja 2). Havaitsemme, että verrattuna siihen, että miehet lähettävät viestejä naisille, kun naiskäyttäjät lähettävät viestejä mieskäyttäjille, he suosivat voimakkaammin potentiaalisten kumppaneidensa työpaikkoja. Kuviossa 3 havaitsemme, että miehet eivät suosi opiskelijoina, kirjanpitäjinä, opettajina tai muissa luokittelemattomissa ammateissa työskenteleviä naisia, kun taas muotoilualalla työskentelevät naiset ovat vastaanotettujen viestien suhteellisella määrällä mitattuna hieman suosittuja, erityisesti ilmailualan palvelualalla työskentelevien miesten keskuudessa. Samaan aikaan havaitsemme myös, että näissä aineistoissa kodinhoitoalalla työskentelevät miehet lähettävät viestejä vain kirjanpitoalalla työskenteleville naisille ja käännösalalla työskentelevät miehet lähettävät viestejä vain naisille, jotka ovat yksityisomistajia, mikä voi johtua käyttäjien käyttäytymisen pienestä otoskoosta näiden ominaisuuksien osalta.

Kuvio 3

Naisille viestejä lähettävien mieskäyttäjien ammattipreferenssi. Pystyakselilla on merkitty miesten ammatit ja vaaka-akselilla naisten ammatit. Preferenssiarvot esitetään eri väreillä

Kuvio 4

Naiskäyttäjien, jotka lähettävät viestejä mieskäyttäjille, työllistymispreferenssi. Pystyakselilla on merkitty naisten ammatit ja vaaka-akselilla miesten ammatit. Preferenssiarvot on esitetty eri väreillä

Kuviosta 4 havaitaan, että miesten suosituimmat ammatit ovat ylempi johto, rahoitus, koulutus ja yksityisomistajat. Useimmilla näissä neljässä ammatissa toimivilla on korkeat tulot tai he ovat hyvin koulutettuja. Epäsuosittuja miespuolisia käyttäjiä ovat koululaiset, myyjät ja muissa luokittelemattomissa ammateissa toimivat. Samaan aikaan kemianteollisuudessa työskentelevät naiset pyrkivät yleensä etsimään koulutuksessa työskenteleviä miehiä, urheilussa työskentelevät naiset pyrkivät yleensä etsimään miehiä, jotka ovat yksityisomistajia, ja poliisialalla työskentelevät naiset lähettävät viestejä vain rahoitus- ja kiinteistöalalla työskenteleville miehille näissä aineistoissa, mikä voi johtua myös käyttäjien käyttäytymisen pienestä otoskoosta näiden ominaisuuksien osalta.

Koulutustasolla on merkittävä vaikutus paritteluun ja avioliittoon . Koulutustasopreferenssit on esitetty kuvioissa 5 ja 6 (attribuuttien merkitykset ja kunkin koulutustason miesten/naisten määrä ja osuus on esitetty lisätiedoston 1 taulukoissa 3 ja 4). Kiinassa, kuten muissakin maissa, myös tohtorin virka viittaa pikemminkin asemaan kuin koulutustasoon. Monilla kiinalaisilla verkkosivustoilla, kun käyttäjä rekisteröityy, postdoctor katsotaan kuitenkin myös tohtorin tutkintoa korkeammaksi koulutustasoksi. Samoin havaitsemme, että kun naiskäyttäjät lähettävät viestejä mieskäyttäjille, he suosivat potentiaalisten kumppaneidensa koulutustasoa enemmän kuin miehet, jotka lähettävät viestejä naisille. Kuvio 5 osoittaa, että miehet, joiden koulutustaso on alle perustutkinnon, etsivät yleensä naisia, joilla on sama akateeminen pätevyys kuin heillä tai alhaisempi kuin heillä, miehet, joiden koulutustaso on korkeampi kuin kandidaatin tutkinto mutta alhaisempi kuin tohtorin tutkinto, etsivät yleensä naisia, joilla on kandidaatin tutkinto, ja miehet, joilla on tohtorin tutkinto tai tohtorin tutkinnon jälkeinen koulutus, etsivät yleensä naisia, joilla on jatkotutkinto. Koulutustasojen mieltymysten osalta miehillä on yleensä tykkää-vetää-ominaisuus. Mieskäyttäjille viestejä lähettävien naiskäyttäjien osalta kuvasta 6 käy ilmi, että perustutkinnon suorittaneet ja jatkotutkinnon suorittaneet miehet ovat suosittuja, ja useimmille naisille perustutkinnon suorittaneet miehet ovat suositumpia, mutta jatkotutkinnon suorittaneet naiset etsivät todennäköisemmin potentiaalisia kumppaneita, joilla on jatkotutkinto. Mitä tulee koulutustasojen suosimiseen, yleensä naisilla on potentiaalisesti houkutteleva ominaisuus. Saksalaisella online-deittisivustolla tehty tutkimus osoitti, että samankaltaisen koulutustaustan suosiminen lisääntyy koulutustason myötä. Naiset ovat haluttomia kommunikoimaan alemman koulutustason omaavien miesten kanssa, mutta miehillä ei ole esteitä ottaa yhteyttä alemman koulutustason omaaviin naisiin.

Kuvio 5

Naiskäyttäjille viestejä lähettävien mieskäyttäjien koulutustason preferenssi. Pystyakseli osoittaa miesten koulutustasot ja vaaka-akseli naisten koulutustasot. Preferenssiarvot esitetään eri väreillä

Kuvio 6

Koulutustason preferenssi naiskäyttäjille, jotka lähettävät viestejä mieskäyttäjille. Pystyakseli osoittaa naisten koulutustasot ja vaaka-akseli miesten koulutustasot. Preferenssiarvot esitetään eri väreillä. Tutkijakoulutetut naiset eivät lähettäneet aineistossa yhtään viestiä miehille, ja asetimme vastaavan rivin elementit arvoon 0

Koulutustaso ja tulot ovat kaksi tärkeää indikaattoria, jotka kuvaavat henkilön sosiaalista ja taloudellista asemaa. Kuvioista 7 ja 8 (katso attribuuttien merkitykset sekä miesten ja naisten määrä ja osuus kunkin tulotason osalta taulukoista 5 ja 6 lisätiedostossa 1) havaitsemme, että tulotason osalta miespuolisilla käyttäjillä on vähemmän selviä mieltymyksiä potentiaalisen kumppanin valinnassa kuin naispuolisilla. Yhtäältä, kuten kuviosta 7 käy ilmi, kaikki miehet suosivat selvästi naisia, joiden kuukausitulot ovat 5000 RMB:n ja 10 000 RMB:n välillä (RMB on Kiinan valuutta, ja 1 RMB = 0,145 Yhdysvaltain dollaria = 0,128 euroa), kun taas naiset, joiden tulot jäävät alle 2000 RMB:n, jäävät selvästi ulkopuolelle. Miehet eivät kuitenkaan selvästi suosi tai sulje pois naisia, joiden tulot ovat yli 10 000 RMB. Toisaalta, kuten kuviosta 8 käy ilmi, kaikki naiset eivät pidä miehistä, jotka ansaitsevat alle 5000 RMB, ja miehet, jotka ansaitsevat 10 000-20 000 RMB, ovat suosituimpia. Tulotason mieltymysten osalta naiset osoittavat yleensä myös potentiaalista vetovoimaa. Kiinalaisella online-deittisivustolla tehdyssä kenttäkokeessa havaittiin, että miehet vierailivat eri tuloluokkaa olevien naisten profiileissa suunnilleen samassa suhteessa, kun taas naisten osalta mitä korkeammat miehen tulot ovat, sitä enemmän heidän profiileissaan käydään , mikä poikkeaa havainnoistamme.

Kuvio 7

Kuukausitulotasojen suosiminen naiskäyttäjille viestejä lähettävien mieskäyttäjien osalta. Pystyakseli osoittaa miesten tulotasot ja vaaka-akseli naisten tulotasot. Preferenssiarvot esitetään eri väreillä

Kuvio 8

Preferenssi kuukausittaisille tulotasoille naiskäyttäjille, jotka lähettävät viestejä mieskäyttäjille. Pystyakseli osoittaa naisten tulotasot ja vaaka-akseli miesten tulotasot. Preferenssiarvot esitetään eri väreillä

Logistinen regressioluokitus

Yhteensopivuuspisteet

Käyttäjien henkilökohtaisilla kotisivuilla kukin käyttäjä on näyttänyt potentiaalisille kumppaneille asettamiaan vaatimuksia, mukaan lukien vaatimukset seitsemälle ominaisuudelle, i.eli ikä, avatar, koulutustaso, pituus, luottokelpoisuusluokitus, asuinpaikka ja siviilisääty (katso useiden ominaisuuksien valintavaatimukset kuvat 1-4 lisätiedostossa 1). Mitä tulee luottoluokitukseen, deittisivustolla käyttäjä saa ensimmäisen tähden eli luottoluokitus on 1 sen jälkeen, kun hän on läpäissyt nopean henkilöllisyyden todentamisen tai ladannut yhden kolmesta asiakirjasta (henkilökortin, passin tai Hongkongin ja Macaon passin) ja läpäissyt arvostelun. Ensimmäisen tähden perusteella joka kerta, kun uusi asiakirja ladataan ja hyväksytään, voidaan lisätä yksi lisätähti tai -luokitus (enintään viisi tähteä, eli viiden tähden jäsen). Vaikka foorumilla käyttäjien alaikäraja on 18 vuotta, vain harvat käyttäjät asettavat vähimmäis- tai enimmäisikää koskevan vaatimuksen alle 18 vuoden iäksi (ks. lisätietoja lisätiedoston 1 kuvasta 3). Sovellamme yhteensopivuuspisteytyksen käsitettä kuvaamaan käyttäjien välistä yhteensopivuutta sen perusteella, täyttääkö käyttäjä toisen käyttäjän valintavaatimuksen vai ei. Kun naiset lähettävät miehille viestejä, kunkin viestin ja kunkin ominaisuuden osalta saadaan niiden naisten osuus, jotka vastaavat miesten mieltymyksiä, ja niiden miesten osuus, jotka vastaavat naisten mieltymyksiä, eli saadaan kaksi vektoria, jotka sisältävät 7 osuutta. Aineiston mukaan saadaan \(\mathbf{w}_{\mathrm{FMm}}= (0.701,0.886,0.462,0.826,0.919,0.786,0.920)\), ja \(\(\mathbf{w}_{\mathrm{FMf}}=(0.912,0.976,0.681,0.962,0.994,0.864,0.912)\), jossa \(\mathbf{w}_{\mathrm{FMm}}\) on miesten mieltymyksiä vastaavien naisten ominaisuuksien osuudet ja \(\(\mathbf{w}_{\mathrm{FMf}}\) on naisten mieltymyksiä vastaavien miesten ominaisuuksien osuudet. Vastaavasti kun miehet lähettävät viestejä naisille, saadaan \(\mathbf{w}_{\mathrm{MFm}}=(0.877,0.977,0.402,0.980,0.992,0.831,0.960)\) and \(\mathbf{w}_{\mathrm{MFf}}=(0.671,0.867,0.572,0.678,0.758,0.771,0.892)\). Näin ollen miehille viestejä lähettävien naisten yhteensopivuuspisteet ovat

$$\\begin{aligned}& c_{\mathrm{FMm}} = \frac{\mathbf{w}_{\mathrm{FMm}}} \cdot { (\textrm{naisen attr. in miehen pref.})}}}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{FMm}} )}}, \end{aligned}$$
(1)

$$\begin{aligned}& c_{\mathrm{FMf}}} = \frac{\{\mathbf{w}_{\mathrm{FMf}}} \cdot (\textrm{male attr. in female pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{FMf}} )}}, \end{aligned}$$
(2)

ja naisille viestejä lähettävien miesten yhteensopivuuspisteet ovat

$$\\begin{aligned}& c_{\{\mathrm{MFm}} = \frac{\{\mathbf{w}_{\mathrm{MFm}} \cdot (\textrm{naisten attr. in male pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{MFm}} )}}, \end{aligned}$$
(3)

$$\begin{aligned}& c_{\mathrm{MFf}} = \frac{\mathbf{w}_{{{\mathrm{MFf}} \cdot (\textrm{male attr. in female pref.})}{ {\operatorname{sum}(\mathbf{w}_{\mathrm{MFf}} )}}, \end{aligned}$$ $$
(4)

missä (female attr. in male pref.) on vektori, joka kuvaa sitä, vastaavatko naispuoliset ominaisuudet miespuolisia mieltymyksiä käyttäjäparin osalta (1 tarkoittaa kyllä ja 0 ei), ja vastaavasti (male attr. in female pref.) on vektori, joka kuvaa sitä, vastaavatko miespuoliset ominaisuudet naispuolisia mieltymyksiä käyttäjäparin osalta. Yhtälöt 1 ja 3 ovat yhteensopivuuspisteitä miespuolisen mieltymyksen ja hänen valitsemansa kumppanin profiilin välillä, ja yhtälöt 2 ja 4 ovat yhteensopivuuspisteitä naispuolisen mieltymyksen ja hänen valitsemansa kumppanin profiilin välillä. Käyttäjäparin \(u_{a}\) ja \(u_{b}\) osalta käytämme pistemäärää eli vastavuoroista pistemäärää ilmaisemaan, kuinka paljon \(u_{b}\):n ominaisuudet vastaavat \(u_{a}\):n mieltymyksiä ja kuinka paljon \(u_{a}\):n ominaisuudet vastaavat \(u_{b}\):n mieltymyksiä. \(u_{a}\) ja \(u_{b}\) välinen vastavuoroinen pistemäärä on näiden kahden käyttäjän yhteensopivuuspisteiden keskiarvo, toisin sanoen, miehille viestejä lähettävien naisten vastavuoroinen pistemäärä on \(\mathit{rs} = (c_{{\mathrm {FMm}} + c_{\mathrm{FMf}} )/2\), ja naisille viestejä lähettävien miesten pistemäärä on \(\mathit{rs} = (c_{{{\mathrm{FMm}} + c_{\mathrm{FFf}} )/2\).

Logistinen regressio

Olkoon click käyttäjien klikkauskertojen määrä, msg käyttäjien vastaanottamien viestien määrä ja rec käyttäjien suosittelemien ja muiden käyttäjien kotisivuilla näkyvien viestien määrä, määrittelemme \(\mathit{pop}_{1} = \mathit{click}/\mathit{rec}\) ja \(\mathit{pop}_{2} = \mathit{msg}/\mathit{rec}\), joilla voidaan luonnehtia käyttäjän suosiota toimien perusteella. Käytämme myös PageRank-keskeisyyttä (\(\mathit{pop}_{3}\)) kvantifioimaan sitä, kuinka keskeinen tai suosittu käyttäjä on verkostossa ottamalla huomioon kaikki verkoston yhteydet. Vetovoimaiset ihmiset, kuten ihmiset, joilla on edullisia demografisia ominaisuuksia ja korkeampi sosioekonominen asema, ovat yleensä keskivertoihmisiä vaativampia potentiaalisen kumppanin valinnan suhteen, mikä käy ilmi tulojen ja koulutustason preferenssianalyysistä luvussa. 3.1.2. Vetovoimaisten ihmisten viehättäviksi kokemat henkilöt voivat olla vielä suositumpia/vetovoimaisempia. Työssä käytetyt muuttujat ja niiden merkitykset on esitetty taulukossa 1.

Taulukko 1 Muuttujat ja niiden vastaavat merkitykset

Me otamme käyttöön useita keskeisyysindeksejä, kuten \(\mathit{pop}_{1}\), \(\mathit{pop}_{2}\), \(\mathit{pop}_{3}\) ja indegree, arvioidaksemme niiden korrelaatiota viestien välittämisen käyttäytymiseen. On huomattava, että keskeisyysindeksit ovat aggregoituja indikaattoreita, jotka kuvaavat käyttäjien haluttavuutta tai suosiota, eivätkä käyttäjät tiedä omia indeksejään eivätkä muiden indeksejä. Käytämme outdegree-astetta kuvaamaan käyttäjien aktiivisuustasoa, ja deittisivustolla käyttäjät eivät myöskään tiedä muiden käyttäjien outdegree-astetta. Todellisuudessa sen sijaan, että käyttäjät käyttäisivät indeksejä houkuttelevien kumppaneiden tunnistamiseen tai valitsemiseen, he lähettävät toisilleen viestejä tarkempien vihjeiden perusteella, kuten korkeampien tulojen, paremman koulutustaustan, houkuttelevien valokuvien tai hyvän demografisen ja sosioekonomisen yhteensopivuuden perusteella. Tässä artikkelissa arvioimme, ovatko indeksit merkittävästi yhteydessä viestikäyttäytymiseen.

Esitetään, että \(p_{i}\) on naispuolisen käyttäjän i todennäköisyys lähettää viestejä, \(1-p_{i}\) on todennäköisyys olla lähettämättä viestejä, jolloin \(L_{f_{i}}=\ln(\frac{p_{i}}{1-p_{i}})\), ts, kaikkien naisten osalta \(L_{f}=\ln(\frac{p}{1-p})\). Vastaavasti, jos \(q_{j}\) on todennäköisyys lähettää viestejä miespuoliselle käyttäjälle i, \(1-q_{j}\) on todennäköisyys olla lähettämättä viestejä, niin \(L_{m_{j}}=\ln (\frac{q_{j}}{1-q_{j}})\), ts, kaikkien miesten osalta \(L_{m}= \ln(\frac{q}{1-q})\). Saadaan logistiset regressiomallit seuraavasti:

$$\\begin{aligned}& L_{f} = \alpha _{1} + {\boldsymbol{\beta} }_{1} \cdot {\mathbf{attribuutti}} + \varepsilon _{\mathrm{1}}, \end{aligned}$$
(5)

$$\begin{aligned}& L_{m} = \alpha _{2} + {\boldsymbol{\beta}_{2} \cdot {\mathbf{attribuutti}} + \varepsilon _{\mathrm{2}}. \end{aligned}$$
(6)

Tässä tutkimuksessa tehdään multikollineaarisuustestit sellaisten riippumattomien muuttujien löytämiseksi, joiden välillä korrelaatiokertoimet ovat alle 0,5 (ks. lisätiedoston 1 taulukot 7 ja 8). Logistisen regression tulokset miehille viestejä lähettävien naisten osalta esitetään taulukossa 2. Huomaamme, että lähes kaikki muuttujat ovat merkitseviä, kun otetaan huomioon vain naisten ominaisuudet (malli 1) eli lähettäjien ominaisuudet, mutta vain naisten asunto ja outdree-aste ovat positiivisesti yhteydessä todennäköisyyteen, että naiset lähettävät viestejä miehille. Kun tarkastellaan vain miesten ominaisuuksia (malli 2), miesten matkapuhelimen todentamista ja luottoluokitusta lukuun ottamatta kaikki muut ominaisuudet ovat merkitseviä ja ovat positiivisesti yhteydessä naisten viestien lähettämisen todennäköisyyteen. Kun otetaan huomioon molempien osapuolten ominaisuudet ja yhteensopivuuspisteet (malli 3), merkitsevistä muuttujista naisen matkapuhelimen todentaminen, auton omistus, luottoluokitus ja suosion taso (\(\mathit{pop}_{1}\) ja \(\mathit{pop}_{3}\)) ovat negatiivisesti yhteydessä naisten viestien lähetystodennäköisyyteen, kun taas muut muuttujat ovat positiivisesti yhteydessä. Havaitsemme, että kun naiset lähettävät miehille viestejä, he ovat huolissaan paitsi siitä, täyttävätkö he miesten vaatimukset myös siitä, täyttävätkö miehet heidän omat vaatimuksensa.

Taulukko 2 Logistisen regression tulokset naiskäyttäjille, jotka lähettävät viestejä mieskäyttäjille

Taulukossa 3 on esitetty logistisen regression tulokset, jotka koskevat miehille viestejä lähettäviä miehiä. Havaitaan, että kun otetaan huomioon vain naisten ominaisuudet (malli 1), kaikki muut muuttujat ovat merkitseviä lukuun ottamatta naisten matkapuhelimen todentamista, luottokelpoisuusluokitusta ja outdegree-astetta, mutta vain naisten omakotitalon omistus vaikuttaa miesten viestien lähettämisen todennäköisyyteen negatiivisesti. Kun tarkastellaan vain miesten ominaisuuksia (malli 2), kaikki muuttujat ovat merkitseviä, mutta vain miesten outdegree korreloi positiivisesti viestikäyttäytymisen kanssa, muut korreloivat negatiivisesti. Kun kaikki muuttujat otetaan huomioon (malli 3), kaikki muut muuttujat ovat merkitseviä lukuun ottamatta naisen luottokelpoisuusluokitusta, outdegree-astetta ja naisen mieltymyksen ja vastaavan toisen osapuolen profiilin yhteensopivuuspistemäärää. Merkittävistä muuttujista naisen matkapuhelimen vahvistus, auton omistus, suosio (\(\mathit{pop}_{1}\), \(\mathit{pop}_{2}\) ja \(\mathit{pop}_{3}\)), miehen outdree-aste ja yhteensopivuuspistemäärä miehen mieltymyksen ja vastaavan vastapuolen profiilin välillä korreloivat positiivisesti viestien välittämisen kanssa, kun taas kaikki muut muuttujat korreloivat negatiivisesti. Lisäksi analysoimalla kahden yhteensopivuuspisteytyksen merkitystä havaitsemme, että miehet kiinnittävät huomiota vain siihen, täyttävätkö naiset heidän omat vaatimuksensa, kun he lähettävät viestejä naisille.

Taulukko 3 Logistisen regression tulokset mieskäyttäjille, jotka lähettävät viestejä naiskäyttäjille

Kuten taulukoista 2 ja 3 voidaan havaita, viestejä lähettävien miesten tai naisten kohdalla vastapuolen suosio on merkitsevästi positiivisesti yhteydessä viestikäyttäytymiseen. Toisaalta \(\mathit{pop}_{1}\) ja \(\mathit{pop}_{2}\) arvot edustavat laskentamenetelmänsä mukaan käyttäjän paikallista suosiota. Toisaalta \(\mathit{pop}_{3}\)-arvo eli PageRank edustaa käyttäjän suosiota globaalista näkökulmasta.

Naisille, jotka lähettävät viestejä miehille, \(\exp (0.390) = 1.477\) miehille \(\mathit{pop}_{1}\) on suurempi kuin \(\exp (0.146) = 1,157\) uros \(\mathit{pop}_{3}\), ja naisille viestejä lähettävien urosten osalta \(\exp (0,462) = 1,587\) naisille \(\mathit{pop}_{1}\) on myös suurempi kuin \(\exp (0,141) = 1,151\) naisille \(\mathit{pop}_{3}\). Näin ollen sekä miehille että naisille toisen osapuolen \(\mathit{pop}_{1}\) on tärkeämpi kuin \(\mathit{pop}_{3}\). Lisäksi havaitsemme myös, että kun naiset lähettävät viestejä miehille, \(\exp (0.390) = 1.477\) miesten \(\mathit{pop}_{1}\) on pienempi kuin \(\exp (0.462) = 1.587\) naaraiden \(\mathit{pop}_{1}\), kun miehet lähettävät viestejä naisille, mikä osoittaa, että verrattuna naisiin, miehillä toisen osapuolen \(\mathit{pop}_{1}\) on enemmän yhteydessä heidän viestikäyttäytymiseensä. Kuitenkin kun naaraat lähettävät viestejä miehille, \(\exp (0.146) = 1.157\) miesten \(\mathit{pop}_{3}\) on suurempi kuin \(\exp (0.141) = 1.151\) naaraiden \(\mathit{pop}_{3}\), kun miehet lähettävät viestejä naisille, mikä osoittaa, että miehiin verrattuna naisilla toisen osapuolen \(\mathit{pop}_{3}\) liittyy enemmän heidän viestikäyttäytymiseensä.

Kiinassa asunnon ja auton omistaminen on henkilön varallisuuden ja sosiaalisen aseman symboli, ja joillakin alueilla niistä on tullut välttämättömyys avioitumiselle. Kun naiset lähettävät miehille viestejä, miehille on tärkeää, että heillä on asunto ja auto. Kun miehet lähettävät viestejä naisille, naisille ei ole tärkeää, että heillä on talo, mutta naisille on jonkin verran tärkeää, että heillä on auto. Huomaamme, että \(\exp(0.038) = 1.039\) sille, onko toisella osapuolella auto, kun miehet lähettävät viestejä naisille, on pienempi kuin \(\exp(0.157) = 1.170\) sille, onko toisella osapuolella auto, kun naiset lähettävät viestejä miehille, mikä osoittaa, että naiset kiinnittävät miehiä enemmän huomiota siihen, onko toisella osapuolella auto.

Käyttäjän out-aste kvantifioi käyttäjän aktiivisuutta. Näennäisen korkea aktiivisuus tarkoittaa yhteydenottoa moniin muihin käyttäjiin, mutta pohjimmiltaan se voi kuitenkin merkitä sitä, että käyttäjät käyttävät enemmän aikaa ja resursseja yrittäessään löytää potentiaalisia kumppaneita. Outdegree on ominaisuus, joka on erilainen miehillä ja naisilla. Kun nainen lähettää viestin miehelle, vastapuolen outdegree on merkitsevästi positiivisesti yhteydessä viestikäyttäytymiseen, mutta ei silloin, kun mies lähettää viestin naiselle. Kun naiset lähettävät viestejä miehille, heidän kontaktoimiensa miesten suosion ja aktiivisuuden verkostomittaukset ovat merkitsevästi positiivisesti yhteydessä heidän viestikäyttäytymiseensä, mutta kun miehet lähettävät viestejä naisille, vain heidän kontaktoimiensa naisten suosion verkostomittaukset ovat merkitsevästi positiivisesti yhteydessä heidän viestikäyttäytymiseensä.

Ensemble learning -luokittelumenetelmät

Suurten datamäärien (big datan) aikakauden kynnyksellä sosiaalisten verkostojen tutkimukseen on vähitellen otettu käyttöön ns. ensemble-oppimismenetelmiä. Jo vuonna 1996 Breiman ehdotti säkitysmenetelmää , ja viisi vuotta myöhemmin hän ehdotti edelleen Random Forest -menetelmää . Freund ehdotti AdaBoost-menetelmää vuonna 1997 , ja koneoppimisluokittimien jatkuvan parantamisen myötä Chen et al. ehdottivat vuonna 2016 luokittimen-XGBoost , joka voi parantaa huomattavasti algoritmin tehokkuutta ja tarkkuutta joissakin tapauksissa. Sovelluksena hiljattain Reece et al. ovat jo soveltaneet koneoppimisvälineitä masennuksen tunnistamiseen Instagram-kuvista .

Regressioanalyysillä on usein tiettyjä vaatimuksia riippumattomille muuttujille, kuten multikollineaarisuuden puuttuminen, mutta ensemble-oppimisen luokittelumenetelmät höllentävät riippumattomien muuttujien rajoituksia. Tässä jaksossa käytetään ensemble-oppimisen luokittelumenetelmiä, kuten bagging-, Random Forest-, AdaBoost- ja XGBoost-menetelmiä, arvioitaessa kunkin taulukossa 1 esitetyn ominaisuuden tärkeyttä. Käytämme R-ohjelmiston pakettia ”adabag” AdaBoost- ja bagging-menetelmien suorittamiseen, pakettia ”randomForest” Random Forest -menetelmän suorittamiseen ja pakettia ”xgboost” XGBoost-menetelmän suorittamiseen. Luokittelijoiden suorituskyvyn arvioimiseksi käytetään viisinkertaista ristiinvalidointia, ja algoritmiparametrit valitaan siten, että saavutetaan vakaa virhetaso. Lähettävien ja ei-lähettävien viestien lukumäärät ovat epätasapainossa aineistossa, ja suuremmasta joukosta otetaan satunnainen osanäyte, jotta saadaan samankokoinen joukko kuin pienemmästä joukosta.

Taulukossa 4 on esitetty neljän ensemble-oppimisen luokitusmenetelmän virhetasot. Huomaamme, että Random Forestin ja AdaBoostin virhetasot ovat alhaisimmat, kun naiset lähettävät viestejä miehille, kun taas XGBoost on alhaisin, kun miehet lähettävät viestejä naisille. Attribuuttien tärkeysjärjestys on esitetty kuvissa 9 ja 10. Kuvasta 9 käy ilmi, että kun naiset lähettävät viestejä miehille, kolme tärkeintä attribuuttia ovat \(\mathit{pop}_{3}\) ja \(\mathit{pop}_{1}\) arvot miehille ja outdegree naisille. Vastaavasti kuvasta 10 käy ilmi, että kun miehet lähettävät viestejä naisille, kolme tärkeintä ominaisuutta ovat \(\mathit{pop}_{3}\) ja \(\mathit{pop}_{1}\) arvot naisille ja outdegree miehille. Sekä miesten että naisten tärkeimpiä viestien lähettämispäätöstä ennustavia tekijöitä ovat potentiaalisten kumppaneiden suosiota kuvaavat \(\mathit{pop}_{3}\) ja \(\mathit{pop}_{1}\) -arvot, jotka ovat myös logistisessa regressiossa merkitsevästi positiivisesti yhteydessä viestikäyttäytymiseen.

Kuvio 9

Attribuuttien suhteelliset tärkeysjärjestykset naisten lähettäessä viestejä miehille eri luokittelumenetelmillä. Vaaka-akselilla esitetään ominaisuudet ja pystyakselilla niiden merkitys. Bagging-, Random Forest- ja AdaBoost-menetelmillä kunkin muuttujan suhteellista tärkeyttä luokittelutehtävässä mitataan Gini-indeksillä, ja XGBoost-menetelmällä suhteellista tärkeyttä mitataan Gain-parametrilla

Kuvio 10

Attribuuttien suhteellisten tärkeysjärjestyksien sijoittuminen miesten lähettäessä viestejä naisiin erilaisilla luokittelumenetelmillä. Vaaka-akselilla on merkitty attribuutit ja pystyakselilla niiden vastaava tärkeys. Bagging-, Random Forest- ja AdaBoost-menetelmillä kunkin muuttujan suhteellista tärkeyttä luokittelutehtävässä mitataan Gini-indeksillä, ja XGBoost-menetelmällä suhteellista tärkeyttä mitataan Gain-parametrilla

Taulukko 4 Virheprosentit ensemble-oppimisen luokittelumenetelmillä käyttämillä luokittelumenetelmillä

Ensemble-oppimisen luokittelun tarkoitus poikkeaa logistisesta regressioanalyysin tarkoituksesta. Kuvien 9 ja 10 mukaan keskeisyysindeksit todellakin osoittavat ylivoimaista merkitystä, ja muut muuttujat osoittavat suhteellisen vähäistä ennustusvoimaa. Tämä ei kuitenkaan tarkoita sitä, että muut muuttujat olisivat hyödyttömiä, ja ne voidaan edelleen liittää merkittävästi käyttäjien viestikäyttäytymiseen logistisessa regressiossa.

Strategisen käyttäytymisen analyysi

Strategisen käyttäytymisen käsite on peräisin taloustieteestä, jossa alkuperäinen implikaatio on, että yritykset ryhtyvät toimiin, jotka vaikuttavat markkinaympäristöön kasvattaakseen voittojaan (viitataan viestien vastausprosenttiin tässä tutkimuksessa), mikä sitten laajennetaan yhteensovittamisongelmiin , kuten paritukseen.

Tutkimuksessamme strategisella käyttäytymisellä tarkoitetaan sitä, lähettääkö käyttäjä viestin toiselle käyttäjälle riippuen siitä, voiko hänen päätöksensä lisätä viestin vastaustodennäköisyyttä. Koska meillä ei ole käyttäjien vastaustietoja, haluaisimme käyttää käyttäjien suosiota kuvaavia keskeisyysindeksejä analysoidaksemme, onko käyttäjillä taipumus lähettää viestejä henkilöille, jotka ovat suositumpia kuin he itse, vai henkilöille, jotka ovat vähemmän suosittuja. Tutkimme käyttäjien strategista käyttäytymistä analysoimalla keskeisyysindeksien välistä korrelaatiota. Korrelaation tasoittavat sovituskäyrät yleistetyllä additiivisella mallilla osoittavat, että käyttäjien keskeisyysindeksien välillä on epälineaarinen tai likimääräinen lineaarinen suhde (katso lisätietoja kuvat 5 ja 6 lisätiedostossa 1), joten käytämme Spearmanin korrelaatiokerrointa korrelaation kuvaamiseen. Kuten taulukoista 5 ja 6 käy ilmi, havaitsemme, että deittisivustolla miehet ja naiset osoittavat erilaisia käyttäytymismalleja viestien lähettämisessä huolimatta verkkoympäristön pienemmistä hylkäämiskustannuksista. Naisille viestejä lähettävien miesten osalta keskeisyysindeksien välillä on heikkoja positiivisia korrelaatioita, joita voidaan luonnehtia pienillä positiivisilla ja merkitsevillä korrelaatiokertoimilla, kun taas miehille viestejä lähettävien naisten osalta keskeisyysindeksien välillä on heikkoja tai vaatimattomia positiivisia korrelaatioita, joita luonnehtivat pienet tai hieman suuremmat positiiviset ja merkitsevät korrelaatiokertoimet. Miehet eivät osoita strategista käyttäytymistä suuressa määrin viestejä lähettäessään, kun taas naisten kohdalla heidän keskeisyysindeksiensä kasvaessa myös heidän viestinsä vastaanottaneiden miesten vastaavat indeksit voivat nousta.

Taulukko 5 Spearmanin korrelaatiokertoimet sentraalisuusindeksien välillä, kun naiset lähettävät viestejä miehille
Taulukko 6 Spearmanin korrelaatiokertoimet sentraalisuusindeksien välillä, kun miehet lähettävät viestejä naisille

Tarkastelemalla samojen sentraalisuusindeksien parien välisiä käyttäjäkohtaisia vastaavien käyttäjäkohtaisia vastaavien parien välisiä riippuvuuksia, analysoimme edelleen, onko käyttäjillä taipumus lähettää viestejä henkilöille, jotka ovat suositumpia kuin he itse, vai henkilöille, jotka ovat vähemmän suosittuja. Kunkin lähettäjien keskeisyysindeksin osalta ilmoitamme vastaavien vastaanottajien indeksien keskiarvon ja keskihajonnan sekä niiden vastaanottajien keskeisyysindeksien osuuden, jotka ovat suurempia kuin lähettäjien indeksit, kuvat 7 ja 8 Additional file 1:ssä. Taulukossa 7 esitetään kunkin keskeisyysindeksin osalta niiden vastaanottajien keskeisyysindeksien osuus, jotka ovat suurempia kuin lähettäjien keskeisyysindeksit viestejä lähetettäessä. Vertailun vuoksi annamme myös satunnaistetut tulokset. Miehiin verrattuna useammat naiset pyrkivät lähettämään viestejä henkilöille, jotka ovat itseään suositumpia.

Taulukko 7 Vastaanottajien centraliteetti-indeksien osuudet, jotka ovat suurempia kuin lähettäjien, kun he lähettävät viestejä

Käyttäjien strategisesta käyttäytymisestä nettideittailussa on tehty useita tutkimuksia. Joissakin tutkimuksissa on havaittu merkittävä positiivinen korrelaatio mies- ja naiskäyttäjien suosion välillä. Esimerkiksi Taylorin ym. tutkimus yhdysvaltalaisista käyttäjistä osoitti, että, heillä on taipumus valita ja tulla valituksi muiden käyttäjien toimesta, joiden suhteellinen suosio on samankaltainen kuin heidän omansa, vaikka se ei välttämättä tarkoita suurempaa onnistumisprosenttia eli useampien vastausten saamista . Hiljattain tehdyssä empiirisessä analyysissä, joka koski neljässä yhdysvaltalaisessa kaupungissa toimivan online-deittisivuston käyttäjiä, käytettiin PageRankia kuvaamaan heidän haluttavuuttaan, ja havaittiin, että sekä miehet että naiset lähettivät viestejä kumppaneille, jotka ovat keskimäärin noin 25 prosenttia itseään haluttavampia . On kuitenkin myös joitakin tutkimuksia, joissa ei ole havaittu korrelaatiota käyttäjien suosion välillä. Esimerkiksi Bostonin ja San Diegon käyttäjiä koskevissa tutkimuksissa ei löydetty todisteita strategisesta käyttäytymisestä . Toinen tutkimus, joka koski erään keskisuuren lounais-amerikkalaisen kaupungin online-deittitietoja, osoitti, että riippumatta omasta haluttavuusasteestaan, joka kuvaa käyttäjien fyysistä vetovoimaa, suosiota, miellyttävyyttä ja aineellisia resursseja, sekä miehillä että naisilla on taipumus lähettää viestejä sosiaalisesti halutuimmille käyttäjille . Havaitsimme, että eri alustoilla tai erilaisissa kulttuurisissa yhteyksissä olevilla käyttäjillä on erilainen strateginen käyttäytyminen, ja taustalla olevia mekanismeja on vielä tutkittava lisää.

Vastaa

Sähköpostiosoitettasi ei julkaista.