13 proiecte Python interesante pe Github pe care ar trebui să le încercați astăzi [2022]
Publicat: 2021-01-08Python este una dintre alegerile de top în limbajele de programare printre profesioniștii din întreaga lume. Sintaxa sa simplă permite dezvoltatorilor de software și cercetătorilor de date să dobândească noi abilități cu ușurință. De asemenea, puteți găsi multe proiecte Python pe GitHub pentru a exersa și a învăța în timp ce faceți.
Cuprins
De ce proiecte Python?
Piața muncii are o cerere mare de profesioniști cu abilități Python, dar nu mulți candidați acordă atenție avantajelor utilizării acestuia. Are biblioteci de suport extinse și structuri de date ușor de utilizat. Și de-a lungul anilor, a apărut ca un instrument excelent pentru construirea de aplicații de linie de comandă. Învățarea python este o parte integrantă a unui curs bun de știință a datelor.
Veți găsi diverse exemple open-source dacă aruncați o privire la proiectele Python de pe GitHub . Depozitul are ceva pentru toată lumea – de la crearea unui simplu generator de parole până la automatizarea sarcinilor de rutină și extragerea datelor Twitter. Pentru începători, o abordare de învățare bazată pe activități poate face minuni. Vă poate ajuta să înțelegeți dezavantajele limbajului, cum ar fi cadrele web Pandas și Django și arhitectura multiproces. Deci, hai să ne scufundăm.
Proiecte Python pe GitHub
1. Magenta
Acest proiect de cercetare Python abordează învățarea automată prin expresie artistică. Inițiat de echipa Google Brain, Magenta se concentrează pe algoritmi de învățare profundă și de învățare prin consolidare care pot crea desene, muzică și altele. Caietele sale colaborative vă vor introduce în detaliile tehnice ale acestui instrument inteligent care își propune să amplifice lucrările creatorilor originali.
Modiply este un alt exemplu de server muzical extensibil pe care îl puteți găsi gratuit pe GitHub.
2. Foton
Este un crawler rapid conceput pentru instrumente de inteligență open-source (OSINT) . Conceptul OSINT implică colectarea de date din surse disponibile public pentru a fi utilizate într-un context de informații. Cu Photon, puteți efectua mai multe funcții de accesare cu crawlere a datelor, inclusiv extragerea următoarelor:
- Adrese URL în domeniul de aplicare și în afara domeniului de aplicare
- URL-uri cu parametri
- E-mailuri și conturi de rețele sociale
- XML, pdf, png și alte fișiere
- găleți Amazon, etc.
3. Mailpile
Acest proiect GitHub este cunoscut pentru funcționalitatea sa de criptare de ultimă generație. Este un instrument de confidențialitate susținut de o comunitate mare. În primul rând, vă permite să trimiteți și să primiți e-mailuri electronice criptate PGP.
Motorul de căutare rapid al Mailpile poate gestiona volume uriașe de date de e-mail și le poate organiza într-o interfață web curată. Folosește reguli statice sau clasificatoare bayesiene pentru etichetarea automată. Parcurgeți software-ul gratuit și demonstrațiile live de pe site-ul său web pentru a afla mai multe!
Citiți despre: Git vs Github: Diferența dintre Git și Github
4. XSSstrike
Cross-site scripting sau XSS este o vulnerabilitate de securitate găsită în aplicațiile web. Atacurile XSS injectează scripturi pe partea clientului, deseori rău intenționate, în paginile web, altfel binevenite. Deci, suita XSStrike a fost dezvoltată pentru a detecta și exploata astfel de atacuri. Acest instrument open-source este echipat cu următoarele caracteristici:
- Patru analizoare scrise de mână
- Un generator inteligent de sarcină utilă
- Un motor eficient de fuzzing
- Un crawler rapid
Cu părțile de mai sus, analizează răspunsul și creează sarcinile utile. De asemenea, poate efectua analize eficiente de context cu fuzzere integrate.
5. Descărcarea imaginilor Google
Acest program Python de linie de comandă poate căuta și descărca sute de imagini Google. Scriptul poate căuta cuvinte cheie și expresii și, opțional, poate descărca fișierele imagine. Google Images Download este compatibil cu versiunile 2.x și 3.x ale Python. Puteți replica codul sursă al acestui proiect pentru a vă perfecționa abilitățile de programare și pentru a înțelege aplicabilitatea acestuia în lumea reală.
6. Proiectul Pandas
Când vine vorba de efectuarea analizei și manipulării flexibile a datelor, biblioteca Pandas se dovedește a fi o resursă excelentă. Structurile sale de date expresive oferă multe beneficii față de alte alternative. Aruncă o privire la unele dintre ele mai jos.
- Flexibilitate în lucrul cu date relaționale/etichetate
- Gestionarea convenabilă a datelor lipsă și mutabilitatea dimensiunii
- Operațiuni intuitive ale setului de date, inclusiv fuziune, remodelare și pivotare
- Funcții de aliniere automată a datelor cu capacități suplimentare
În timp ce căutați prin baza de cod a panda, veți întâlni diverse probleme în documentație. Acest lucru vă poate determina să contribuiți cu propriile idei și să îmbunătățiți instrumentul existent. Puteți găsi pachetul open-source pe GitHub împreună cu alte pachete precum Django și Keras care permit experimentarea rapidă.
7. Xonsh
Aplicațiile interactive necesită interpreți de linie de comandă precum Unix. Astfel de sisteme de operare controlează execuția folosind scripturi shell. Acum, în loc să faci un compromis, nu ar fi mai convenabil dacă shell-ul tău ar putea înțelege un limbaj de programare mai scalabil? Aici intră Xonsh (pronunțat „Konk”).
Este un limbaj shell alimentat de Python și comandă prompt. Acest limbaj multi-platformă este ușor de scriptabil și vine cu o bibliotecă standard vastă și tipuri de variabile. Xonsh are, de asemenea, propriul sistem de management al mediului virtual numit vox.

8. Manim
Manim este prescurtarea de la Mathematical Animation Engine. Acest proiect este despre crearea programatică a explicatorilor video. Programul rulează pe Python 3.7 și produce conținut video animat, acoperind subiecte complexe cu ajutorul ilustrațiilor și a graficelor de afișare. Puteți viziona aceste videoclipuri pe canalul YouTube 3Blue1Brown.
Codul sursă pentru Manim este disponibil gratuit pe GitHub. De asemenea, puteți consulta tutorialele online pentru a afla cum să instalați pachetul, să rulați un proiect și să creați proiecte personale simple.
Citiți: Idei și subiecte pentru proiecte de știință a datelor
9. Analiza AI baschet
Acest proiect este construit pe conceptul de detectare a obiectelor. Aplicația de inteligență artificială caută în datele colectate pentru a analiza loviturile de baschet. Puteți găsi cu ușurință aplicația web AI și API-ul sub Python Projects pe GitHub . Să vedem cum funcționează instrumentul:
- Încărcați fișiere în aplicația web
- Alternativ, puteți trimite o solicitare POST către API
- Biblioteca OpenPose implementează calcule
- Aplicația web produce rezultate pe baza datelor privind pozițiile de fotografiere
10. Rebound
Este obișnuit ca codurile sursă ale programelor de calculator să întâmpine erori ale compilatorului. Rebound poate prelua instantaneu rezultatele StackOverflow într-un astfel de scenariu. Este un instrument de linie de comandă scris în Python și construit pe interfața de utilizator a consolei Urwid. Dacă alegeți să implementați acest proiect, puteți afla cum pachetul Beautiful Soup reduce conținutul StackOverflow. De asemenea, vă puteți familiariza cu subprocesul care prinde erorile compilatorului.
11. NeutralTalk
Vă puteți ajusta cunoștințele despre rețelele neuronale recurente multimodale cu NeutralTalk. Este un proiect Python și NumPy care se concentrează pe descrierea imaginilor.
De obicei, metodele de generare a subtitrărilor implică o fuziune a viziunii computerizate și procesării limbajului natural. Sistemul poate înțelege scene și poate produce descrieri ale conținutului observat într-o imagine.
Dacă sunteți în căutarea celui mai recent cod de subtitrăre, puteți consulta NeutralTalk2. Scris în Lua, un limbaj de programare ușor și de nivel înalt, acest proiect este mai rapid decât versiunea originală.
12. Proiecte TensorFlow
TensorFlow este o bibliotecă Python folosită pentru construirea de modele de învățare profundă. Depozitul Model Garden centralizează multe exemple de cod pentru utilizatorii TensorFlow într-un singur loc. Acesta își propune să prezinte cele mai bune practici pentru cercetare și dezvoltare de produse, oferind în același timp modele pregătite în prealabil gata de utilizare. Cu ajutorul acestei resurse oficiale, puteți explora cum să implementați instruirea distribuită și să rezolvați problemele de viziune computerizată și NLP.
13. Importator de modele de hărți
Hărți Modele Importer funcționează prin importul de modele 3D de pe hărți extinse. Este un instrument experimental care conține doar un supliment Blender, iar procesul necesită software de conținut 3D, cum ar fi Google Maps. În acest proiect, puteți înțelege importarea modelelor de pe Google Maps.
Citește și: Idei de proiecte Python și subiecte pentru începători
Scopul viitor pentru Python
Industria modernă caută din ce în ce mai mult să descopere tipare ascunse din pool-urile de date. Mai mult, tehnologiile emergente precum inteligența artificială și învățarea automată adaugă noi capacități și complexități peisajului. Și limbajul de nivel înalt precum Python este parte integrantă a procedurilor de dezvoltare și analiză software.
Desigur, recrutorii din ziua de azi acordă o valoare imensă abilităților Python atunci când angajează pentru roluri precum științific de date, analist de date/cercetare, dezvoltator Python, inginer DevOps etc. Oferă mari în tehnologie precum Google, Facebook, Spotify, Netflix, Dropbox și Reddit. opțiuni de carieră profitabile pentru candidații cu pregătire practică.
Sperăm că vă puteți perfecționa abilitățile de programare cu lista de mai sus pentru proiectele Python de pe GitHub . Pe măsură ce piața de date mari evoluează și se extinde în continuare, comunitatea open source Python este de așteptat să lanseze și mai multe biblioteci în următorii ani. Așadar, fii la curent și continuă să înveți!
Dacă sunteți curios să aflați despre știința datelor, consultați programul Executive PG în știința datelor de la IIIT-B și upGrad, care este creat pentru profesioniști care lucrează și oferă peste 10 studii de caz și proiecte, ateliere practice practice, mentorat cu experți din industrie, 1 -on-1 cu mentori din industrie, peste 400 de ore de învățare și asistență profesională cu firme de top.
Care sunt câteva idei de proiecte de învățare automată pentru începători?
Mai jos sunt câteva proiecte Ml interesante care folosesc Python ca limbaj de programare principal: Unele dintre tweet-uri pot fi puțin jignitoare pentru un public respectiv, iar Instrumentul de sortare a Tweets poate fi folosit pentru a le evita. Acest proiect de învățare automată filtrează tweet-urile pe baza unor cuvinte cheie. Lucrul la rețeaua neuronală este unul dintre cele mai bune domenii pentru a vă testa conceptele de învățare automată. Clasificatorul de caractere scrise de mână funcționează pe rețelele neuronale pentru a identifica alfabetele englezești scrise de mână din AZ. Modelul de analiză a sentimentelor este folosit pentru a detecta și identifica sentimentele și sentimentele unei persoane din spatele unei postări sau imagini postate pe rețelele sociale. Acesta este un proiect bun la nivel de începător și puteți obține datele de la Reddit sau Twitter pentru el.
Descrieți componentele majore pe care ar trebui să le aibă un proiect Python.
Următoarele componente evidențiază cea mai generală arhitectură a unui proiect Python - Problem Statement este componenta fundamentală pe care se bazează întregul proiect. Acesta definește problema pe care modelul tău o va rezolva și discută abordarea pe care o va urma proiectul tău. Setul de date este o componentă foarte esențială pentru proiectul dvs. și trebuie ales cu atenție. Pentru proiect ar trebui folosite doar seturi de date suficient de mari din surse de încredere. Algoritmul pe care îl utilizați pentru a vă analiza datele și a prezice rezultatele. Tehnicile algoritmice populare includ algoritmi de regresie, arbori de regresie, algoritmul Bayes naiv și cuantizarea vectorială.
Poate fi folosit Python pentru proiecte de procesare a imaginilor și, dacă da, ce biblioteci Python pot fi folosite?
Următoarele sunt câteva dintre bibliotecile de top Python care fac construirea proiectelor de procesare a imaginii foarte convenabilă. OpenCV este, fără îndoială, cea mai populară și utilizată bibliotecă Python pentru sarcini de vedere, cum ar fi procesarea imaginilor și detectarea obiectelor și feței. Conversația despre bibliotecile de procesare a imaginilor Python este incompletă fără Sci-Kit Image. Este o bibliotecă simplă și simplă care poate fi folosită pentru orice sarcină de viziune computerizată. SciPy este utilizat în principal pentru calcule matematice, dar este și capabil să efectueze procesarea imaginilor. Detectarea feței, Convoluția și Segmentarea imaginii sunt câteva dintre caracteristicile oferite de SciPy.