Yttre SQL-anslutningar

Börjar du här? Den här lektionen är en del av en fullständig handledning i att använda SQL för dataanalys. Kolla in början.

I den här lektionen täcker vi:

  • Yttre går med
  • Crunchbase-datasetet

Yttre sammanfogningar

När du utför en inre koppling returneras rader från endera tabellen som inte matchas i den andra tabellen. I en yttre koppling kan omatchade rader i en eller båda tabellerna returneras. är några typer av yttre sammanfogningar:

  • LEFT JOIN returnerar endast omatchade rader från vänster tabell.
  • RIGHT JOIN returnerar endast omatchade rader från höger tabell.
  • FULL OUTER JOIN returnerar omatchade rader från båda tabellerna.

När du arbetar igenom följande lektioner om yttre sammanfogningar kan det vara till hjälp att hänvisa till denna JOIN-visualisering av Patrik Spathon.

Crunchbase-datauppsättningen

Uppgifterna för följande lektioner hämtades från Crunchbase, ett publikt index över nystartade företag, grundare, investerare och alla aktiviteter tre. Det samlades 5 februari 2014 och stora delar av båda borden släpptes slumpmässigt för denna lektions skull. Den första tabellen visar en stor del av företagen i databasen. en rad per företag. Fältet permalink är en unik identifierare för varje rad och visar också webbadressen. För varje företag i tabellen kan du se dess Crunchbase-profil online genom att kopiera / klistra in dess permalänk efter Crunchbases webbdomän. Till exempel har det tredje företaget i tabellen ”.Club Domains” permalänken ”/ company / club-domains”, så dess profiladress skulle vara http://www.crunchbase.com/company/club-domains. Fälten med ”finansiering” i namnet har att göra med hur mycket externa investeringar (i USD) varje företag har tagit på sig. Resten av fälten är självförklarande.

Den andra tabellen visar förvärv – en rad per förvärv. company_permalink i denna tabell mappar till permalink -fältet i tutorial.crunchbase_companies som beskrivs i föregående lektion . Att gå med i dessa två fält kommer att lägga till information om företaget som förvärvas.

Du kommer också att märka att det finns ett separat fält som heter acquirer_permalink. Detta kan också vara mappad till permalink -fältet tutorial.crunchbase_companies för att lägga till ytterligare information om det förvärvande företaget.

Den utländska nyckeln du använder för att gå med i dessa två tabeller beror helt på om du vill lägga till information om det förvärvande företaget eller företaget som förvärvades.

Det är värt noterar att denna typ av struktur är vanlig. Till exempel kan en tabell som visar en lista med skickade e-postmeddelanden innehålla en sender_email_address och en recipient_email_address, båda kartläggs till en tabell med e-postadresser och deras ägares namn.

Leave a Reply

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *