Web scraper, který zveřejňuje 10 nejlepších blogů bez lidského zásahu

Jedním z problémů, které shledáváme u některých příspěvků s doporučením projektů, je to, že doporučují projekty, které nejsou realizovány způsobem, který by programátora nadchl pro další vývoj. Například vidím, že spousta lidí doporučuje vytvořit webový scraper.

Když už jste ten webový scraper vytvořili a seškrábali data, co s nimi budete dělat?

Místo pouhého seškrábání dat, proč nevytvořit webovou stránku s těmito daty. Nemusí to být nijak efektní ani to nemusí mít spoustu zobrazení. Tento scraper by mohl data stáhnout do databáze a pak vybrat nejoblíbenější příspěvky. Odtud by mohl zkopírovat název spolu s několika větami a poté vytvořit příspěvek, který by sdílel online. Byl by to působivý a jednoduchý projekt, kterým byste se mohli skutečně pochlubit.

Teď jste ukázali, že umíte víc než jen nakódovat malý segment systému. Místo toho dokážete promyslet celý systém. Musíte zvážit, jak budete automatizovat proces, spravovat databázi, vytvářet webové stránky a vybírat příspěvky. To vám také umožní mít skutečně hmatatelný konečný produkt.

Bez hmatatelného konečného produktu je opravdu snadné ztratit motivaci a jednoduše se zastavit pouze u webového škrabáku.

Kromě toho nikdy nevíte, třeba se vaše stránky stanou populárními!

Dovednosti: Databáze, webový scraper, automatizace, vývoj webu (pro blog) a obecné programování.

Systém upozorňování na události pomocí rozhraní Meetup a Eventbrite API

Chtěli jste někdy jít na koncert kapely nebo komika, ale zjistili jste, že je to až minulý týden? Možná se ve vašem okolí konala bezplatná konference o datové vědě nebo velkých datech a vy jste ji prošvihli, protože jste se zapomněli podívat.

Proč si nevytvořit vlastní agregátor využívající rozhraní Meetup a Eventbrite API, který vás upozorní na klíčová slova v popisech nebo názvech akcí? Předpokládám, že Meetup i Eventbrite teď mají podobné možnosti. Ale vždycky je zábavné zkusit si vytvořit vlastní systém.

Můžete si systém přizpůsobit tak, aby fungoval podle vašich představ, a možná i umožnit ostatním lidem vytvářet vlastní upozornění tím, že z toho uděláte webovou stránku. Na tomto projektu nás baví to, že si můžete procvičit práci se dvěma různými rozhraními API. To vám umožní porovnat a smluvit, co se vám na nich líbí a nelíbí. Pokud tak někdy budete mít na starosti vytváření API, budete mít lepší představu o tom, co funguje a co ne.

Dovednosti: API, databáze, automatizace, vývoj webu a obecné programování.

Kopírovací kočka 9GAG

9GAG

Při vytváření vlastních projektů se nemusíte vždy snažit znovu vynalézat kolo. Jednoduché projekty, jako je web, který umožňuje přihlášení, zveřejňování fotografií, GIFů a umožňuje procházení kanálu, poskytují příležitost vytvořit nejprve solidní základní web. Pak můžete přidat spoustu zajímavých funkcí, jako je sledování, lajkování a vyhledávání. Zejména vyhledávání by bylo skvělou příležitostí naučit se, jak fungují doporučovací systémy a strojové učení!“

Vždycky je zábavné zkoušet replikovat populární stránky. Ve skutečnosti je to vlastně skvělý způsob, jak se učit, protože každou funkci musíte zpětně analyzovat. Reverzní inženýrství je skvělá dovednost, protože jako softwarový inženýr budete neustále udržovat kód jiných lidí a budete se jim muset dostat do hlavy.

Dovednosti: Strojové učení (pro doporučovací systém), databáze, automatizace, vývoj webových aplikací a obecné programování.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.