Web scraper, joka julkaisee top 10 -blogeja ilman inhimillistä väliintuloa

Yksi ongelmista, joita huomaamme joidenkin projektisuositusviesteissä, on se, että ne suosittelevat projekteja, joita ei ole toteutettu niin, että ohjelmoija innostuisi jatkamaan kehitystä. Näen esimerkiksi, että monet suosittelevat web-skrapperin rakentamista.

Kun olet rakentanut tuon web-skrapperin ja kaapinut datan, mitä aiot tehdä sillä?

Sen sijaan, että vain kaappaisit dataa, miksi et rakentaisi verkkosivua tuon datan avulla. Sen ei tarvitse olla hieno tai saada paljon katselukertoja. Tämä scraper voisi vetää tiedot tietokantaan ja sitten valita suosituimmat viestit. Sieltä se voisi kopioida otsikon ja muutaman lauseen ja luoda postauksen, jonka se jakaa verkossa. Tämä olisi vaikuttava ja yksinkertainen projekti, jota voisit oikeasti esitellä.

Olet nyt osoittanut, että osaat tehdä muutakin kuin vain koodata pienen osan järjestelmästä. Sen sijaan osaat ajatella läpi kokonaisen järjestelmän. Sinun on mietittävä, miten aiot automatisoida prosessin, hallita tietokantaa, luoda verkkosivuston ja valita viestit. Näin sinulla on myös todella konkreettinen lopputuote.

Koska sinulla ei ole konkreettista lopputuotetta, on todella helppoa muuttua epämotivoituneeksi ja vain pysähtyä pelkkään verkkokaapimiseen.

Ei sitä paitsi koskaan tiedä, ehkäpä sivustostasi tulee suosittu!

Taitoja: Tietokanta, web scraper, automaatio, web-kehitys (blogia varten) ja yleinen ohjelmointi.

Tapahtumailmoitusjärjestelmä, joka käyttää Meetupin ja Eventbriten API-rajapintoja

Oletko koskaan halunnut mennä bändin tai koomikon keikalle, mutta tajunnut, että se oli viime viikolla? Ehkä alueellasi oli ilmainen konferenssi datatieteestä tai big datasta, mutta et päässyt paikalle, koska unohdit tarkistaa sen.

Miksi et tekisi omaa aggregaattoria käyttäen Meetupin ja Eventbriten API:ita, joka varoittaa sinua, kun tapahtuman kuvauksissa tai otsikoissa on avainsanoja? Nyt oletan, että sekä Meetupilla että Eventbriteillä on samanlaiset vaihtoehdot. Mutta on aina hauskaa yrittää rakentaa oma järjestelmä.

Voit muokata järjestelmän toimimaan haluamallasi tavalla ja ehkä jopa antaa muiden ihmisten tehdä omia hälytyksiä tekemällä tästä verkkosivuston. Nautimme tässä projektissa siitä, että voit harjoitella työskentelyä kahden eri API:n kanssa. Näin voit vertailla ja tehdä sopimuksen siitä, mistä pidät ja mistä et pidä niissä. Näin, jos olet joskus vastuussa API:n rakentamisesta, sinulla on parempi kuva siitä, mikä toimii ja mikä ei.

Taitoja: Yksinkertaiset projektit, kuten sivusto, johon voi kirjautua, lähettää valokuvia ja GIF-kuvia ja jossa voi selata syötettä, tarjoavat mahdollisuuden luoda ensin vankka perussivusto. Sitten voit lisätä paljon mielenkiintoisia ominaisuuksia, kuten seuraamista, tykkäämistä ja hakua. Erityisesti haku olisi loistava tilaisuus oppia, miten suosittelujärjestelmät ja koneoppiminen toimivat!

On aina hauskaa yrittää kopioida suosittuja sivustoja. Itse asiassa se on itse asiassa loistava tapa oppia, koska joudut kääntämään jokaisen ominaisuuden taaksepäin. Reverse engineering on loistava taito, koska ohjelmistosuunnittelijana ylläpidät jatkuvasti muiden ihmisten koodia ja sinun on päästävä heidän päähänsä.

Taitoja: Koneoppiminen (suosittelujärjestelmää varten), tietokanta, automaatio, web-kehitys ja yleinen ohjelmointi.

Vastaa

Sähköpostiosoitettasi ei julkaista.