Începând de aici? Această lecție face parte dintr-un tutorial complet privind utilizarea SQL pentru analiza datelor. Verificați începutul.
În această lecție vom acoperi:
- Îmbinări exterioare
- Setul de date Crunchbase
Îmbinări exterioare
Atunci când efectuați o îmbinare interioară, rândurile din oricare dintre tabele care nu sunt egale în celălalt tabel nu sunt returnate. Într-o îmbinare exterioară, rândurile neegalate dintr-una sau ambele tabele pot fi returnate. sunt câteva tipuri de îmbinări exterioare:
-
LEFT JOIN
returnează numai rânduri neegalate din tabelul din stânga. -
RIGHT JOIN
returnează numai rândurile neegalate din tabelul din dreapta. -
FULL OUTER JOIN
returnează rândurile neegalate din ambele tabele.
Pe măsură ce parcurgeți următoarele lecții despre îmbinările exterioare, ar putea fi util să consultați această vizualizare JOIN de către Patrik Spathon.
Setul de date Crunchbase
Datele pentru următoarele lecții au fost extrase de la Crunchbase, un index crowdsourced de startup-uri, fondatori, investitori și activitățile tuturor Trei. A fost colectat pe 5 februarie 2014, iar porțiuni mari din ambele tabele au fost abandonate aleatoriu de dragul acestei lecții. Primul tabel listează o mare parte a companiilor din baza de date; un rând pe companie. Câmpul permalink
este un identificator unic pentru fiecare rând și afișează, de asemenea, adresa web. Pentru fiecare companie din tabel, îi puteți vizualiza profilul online Crunchbase copiind / lipind legătura sa permanentă după domeniul web Crunchbase. De exemplu, a treia companie din tabel, „Domenii .Club”, are legătura permanentă „/ company / club-domains”, deci adresa profilului său ar fi http://www.crunchbase.com/company/club-domains. Câmpurile cu „finanțare” în nume au legătură cu investițiile externe (în USD) asumate de fiecare companie. Restul câmpurilor se explică de la sine.
Al doilea tabel listează achizițiile – un rând pe achiziție. company_permalink
în acest tabel se mapează la câmpul permalink
din tutorial.crunchbase_companies
așa cum este descris în lecția anterioară . Alăturarea la aceste două câmpuri va adăuga informații despre compania achiziționată.
Veți observa că există și un câmp separat numit acquirer_permalink
. Acest lucru poate fi, de asemenea, mapat la câmpul permalink
tutorial.crunchbase_companies
pentru a adăuga informații suplimentare despre compania achizitoare.
Cheia externă pe care o utilizați pentru a vă alătura acestor două tabele va depinde în întregime de dacă doriți să adăugați informații despre compania care a achiziționat sau despre compania care a fost achiziționată.
Merită observând că acest tip de structură este comun. De exemplu, un tabel care prezintă o listă de e-mailuri trimise poate include un sender_email_address
și un recipient_email_address
, ambele mapează un tabel cu listele de adrese de e-mail și numele proprietarilor acestora.