Gå til hovedindhold
Version2 it for professionelle
Forsiden

Hovedmenu

  • It-nyheder
  • Blogs
  • It-job
  • It-firmaer
  • Whitepapers
  • Opret bruger
  • Log ind
Du kan logge ind med din e-mail-adresse
Der er forskel på store og små bogstaver i adgangskoden.
Glemt adgangskode?
Se kommentarer (6)
Emner Karriere, Databaser

Dansk ph.d.-studerende 10-dobler ydelsen i database-søgninger: Vil bygge millionvirksomhed på sin forskning

Hvordan kan Facebook bedst foreslå dig nye venner? Hvor mange forskellige skuespiller-par har spillet sammen i mindst én film? Den slags spørgsmål kan Rasmus Resen Amossens forskning give et hurtigt svar på - og det kan være mange penge værd.

Af Tania Andersen Mandag, 27. september 2010 - 6:59

For mange virksomheder er databasen flaskehalsen, når det handler om ydelse. Der bruges der mange resurser på at forbedre ydelsen, og derfor forsker Rasmus Resen Amossen i, hvordan man kan få forespørgsler til at gå hurtigere. Om to måneder skal han aflevere sit ph.d-projekt på området.

Ydelsen kan forbedres på forskellige måder, fortæller han. Man kan prøve at tilgå data på en smartere måde, tilgå mindre mængder data, eller prøver at øge den mængde data, man kan behandle i et givent tidsrum.

»Og jeg har lavet noget inden for alle tre kategorier. En stor del af det jeg har kigget på, er hvordan man kan finde relationer mellem enheder.«

Facebook har for eksempel en funktion, som kan anbefale nye potentielle bekendtskaber.

»Det er dine venners venner, den foreslår, men da Facebook har over 300 millioner brugere, er alle par af potentielle venner rigtig hårdt at beregne. Derfor bliver man nødt til at gøre det smart.«

Et andet eksempel på at finde relationer kan være at finde to skuespillere, der har spillet sammen i mindst én film, ud fra filmdatabasen IMDB.

Problemet består i, at man typisk kommer til at behandle samme par mange gange. I Rasmus Resen Amossens eksperiment med skuespillerparene kiggede han på 37.000 skuespillere og 8.100 film. Her fandt han 676 millioner skuespillerpar, men kun 70 millioner, godt en tiendedel, af disse var forskellige. Hvis man ikke gør noget smart, kommer man i snit til at behandle samme par ti gange. Det er spild af arbejde.

Andre områder er økonomi, hvor man ved at kigge på boner fra supermarkeder kunne finde ud af, hvad folk ofte køber sammen med andre varer.

Færre data giver hurtigere søgninger

En anden problemstilling er, hvordan man kan behandle mindre mængder af data.

»Data bliver lagt ned i databasen på den måde, som den nu gør, men det følger typisk ikke det tilgangsmønster, der efterfølgende er til de data. Hvis man lægger data ned i databasen og tilgår det på på en bestemt måde, udnytter databasen det ikke. Ofte er databasen derfor nødt til at håndtere en masse data, selvom kun en lille del er relevant for en given forespørgsel.«

Her har Rasmus Resen Amossen fundet på noget, som skal danne grundlag for en ny virksomhed.

»Mange synes det er utroligt interessant, så nu prøver jeg at gå videre med det og stable en virksomhed på benene og få en investor.«

Den tredje mulighed er at prøve at øge mængden af data man kan tilgå i et givent tidsrum. Her har Rasmus Resen Amossen prøvet at kanalisere databasens beregninger over på grafikkortets kerner, og det har også givet væsentlige forbedringer i ydelse.

Kæmpe marked for databaseforbedringer

Det er ideen om at behandle færre data, som har et kommercielt potentiale. Med en investering på 4,5 millioner kan Rasmus Resen Amossen nå et marked på 710 millioner årligt, vurderer han.

»Det lokker mig lidt at gå ud og prøve at bruge det i det virkelige liv.«

Teknologien kan iføølge Rasmus Resen Amossen skydes ind som et mellemlag i de store kommercielle databaseleverandørers produkter.

»Jeg har lavet nogle indledende tests, som viser, at jeg i visse tilfælde kan få 90 procents ressourcereduktion. Det svarer groft sagt til ti gange forbedring af ydelsen, afhængig af et antal faktorer: Hvis jeg skal tilgå ti procent af den data jeg ellers skulle tilgå, så kan jeg forvente at hver forespørgsel går ca. ti gange så hurtigt.«

I mange tilfælde er en forbedring på bare to gange noget, som er værd at stræbe efter.

»Man kan købe mere hardware, men hvis du køber dobbelt så dyr hardware, går du ikke dobbelt op i ydelse. Derfor er der et marked for det her.«

Rasmus Resen Amossen skal aflevere sin ph.d-afhandling sidst i november. Han har taget sin kandidatgrad på DIKU, men læser ph.d. på ITU.

Version2 starter med denne artikel en ny serie om aktuel, it-relateret ph.d-forskning.

Send Tweet
Udskriv

IT-job & karriere

  • Se alle it-job
  • Importer din kompetenceprofil fra LinkedIn
Salesforce.com - udviklere til Vallensbæk
Udgivet 30. nov 2011 10.44
Talents til Technology Consulting – Har du 0-2 års erfaring, så har vi en udfordring til dig!
Udgivet 12. sep 2011 13.39
Microsoft Dynamics AX Technical Consultant/Developer
Udgivet 27. apr 10.39
SAP Senior Solution Architect - Business Warehouse and Business Intelligence
Udgivet 27. apr 11.01

Kommentarer (6)

Opret en konto eller log ind for at følge indhold på Version2 - og bliv opdateret via e-mail eller rss

Følg kommentarer
Troels Arvin 27. sep. 2010 - 09.55
 
Hvordan gøres det?

Jeg kan forstå, at det med grafikkort er blandt tiltagene mht. at "øge den mængde data, man kan behandle i et givent tidsrum". Men artiklen beskriver ikke rigtig noget om, hvordan de to andre mål angribes.

Hvordan tilgås data på en smartere måde, dvs. hvordan undgås det at data gen-behandles unødigt? Og hvordan er det at mindre datamængder skal tilgås - der står blot, at Amossen har "fundet på noget".

Kan niveauet ikke hæves lidt?

  • Stem op 0
  • Stem ned 0
  • Log ind eller opret en konto for at skrive kommentarer
Christian Sparre 27. sep. 2010 - 11.27
 
Re: Hvordan gøres det?

Det får vi nok ikke at vide eftersom han vil basere en virksomhed på sin forskning :)

  • Stem op 0
  • Stem ned 0
  • Log ind eller opret en konto for at skrive kommentarer
Ulrik Friis 27. sep. 2010 - 11.51
 
Re: Hvordan gøres det?

...og inden vil han have forsvaret sin ph.d. afhandling, som er offentlig tilgængelig, så det...

  • Stem op 0
  • Stem ned 0
  • Log ind eller opret en konto for at skrive kommentarer
Erik Beck Jensen 27. sep. 2010 - 11.59
 
hvordan fanger man kameler?

jo man tager en ørken og sier alt sandet,når man så er færdig skullle det være mærkeligt hvis der ikke var en kamel i sien.Jeg vil tro, at det omvendte pricip, er det der benytttes her?kig efter de mønstre der ligner en kamel, og si dem fra

  • Stem op 0
  • Stem ned 0
  • Log ind eller opret en konto for at skrive kommentarer
John Vedsegaard 27. sep. 2010 - 14.52
 
Afhænger vel af til hvad.

Problemet er ofte at de anvendte databaser er overgearede til deres formål.

Mange relationsdatabaser indeholder i virkeligheden kun ganske få oplysninger, tag f.eks. De Gule Sider, der er ekstremt langsomt, men i virkeligheden indeholder sådan en database kun få felter for hver enkelt post.

Tager man eksemplet Facebook,burde det kunne bygges på nogle få index, måske er det allerede sådan og jeg syntes data kommer nogenlunde hurtigt.

Ser man på google går det i forvejen meget hurtigt, selv om det sagtens kunne forbedres, for eksempel så alle søgte data kan opbevares lokalt i en database med 1 index, indeholdende søgeordene og resultaterne. Så skal søgningen kun kikke efter nyere data, ikke de gamle igen. Det smarte ved sådan en database, er at den nemt kan laves så man kan vælge at have flere versioner af f.eks. de samme hjemmesider.

De reduktioner i søgningerne Rasmus taler om, er smart i sig selv, hvis det kan lade sig gøre og man alligevel vil få de ønskede data frem, måske har google allerede sådan et system. Har Rasmus fundet på en ny algoritme til formålet, spår jeg hans firma en fremtid der vil noget, særligt hvis det kan patenteres. 90% reduktion er ganske meget, selv om det nok er optimistisk, 20-30% har også en voldsomt stor betydning, faktisk så meget at de fleste store databaser vil være nødt til at købe det.

Den med at bruge grafik kort til databehandling tror jeg til gengæld ikke meget på. der skal simpelthen bare nogle bedre computere til, vi taler jo nok ikke om hjemmecomputere i den her forbindelse.

  • Stem op 0
  • Stem ned 0
  • Log ind eller opret en konto for at skrive kommentarer
Henrik Christiansen 27. sep. 2010 - 18.34
 
oracle

jeg tror vidst der mangler nogle detaljer. Tror næppe én dansk ph.d studerende, gennem hans uddannelse bare lige sådan har opfundet en bedre måde at gøre tingene på end fx oracle, eller andre store database firmaer ikke har tænkt på. Vil tro database-søgning skal specificeres MEGET mere ud i detaljer, og det måske er en lille bitte niche del, der i den store sammenhæng måske kan betyde promille forbedringer. Det lyder alt for smart og godt til at være sandt, bare det jeg vil sige med det.

  • Stem op 0
  • Stem ned 0
  • Log ind eller opret en konto for at skrive kommentarer

Tilføj kommentar

Opret en konto eller log ind for at følge indhold på Version2 - og bliv opdateret via e-mail eller rss

Følg kommentarer
Log ind herunder eller opret en bruger for at skrive kommentarer
Du kan logge ind med din e-mail-adresse
Der er forskel på store og små bogstaver i adgangskoden.
Glemt adgangskode?

Seneste nyt

Meego-afløseren Tizen klar til at tage kampen op med Android

Udgivet 23. maj 16.01Opdateret 23. maj 16.01

Massiv logning af danskernes internetbrug - men politiet bruger kun IP-adressen

Udgivet 23. maj 15.22Opdateret 23. maj 15.22

198 IBM-medarbejdere fritstillet med øjeblikkelig virkning

Udgivet 23. maj 14.28Opdateret 23. maj 15.10

Mystisk Project X afsløret: Rent flashlager giver fænomenal IOPS-ydelse

Udgivet 23. maj 14.19Opdateret 23. maj 14.19

Region sparer licens-millioner på at lukke ”Grønt System”

Udgivet 23. maj 13.22Opdateret 23. maj 13.22

Flere it-nyheder »

Tilmeld dig Version2's it-nyhedsbrev og vind den nye iPad.

Whitepapers

Kick-start your master data management initiative

Affecto Denmark

Affecto Data Quality Assessment: Er din indsigt og beslutning baseret på validt data?

Affecto Denmark

Framework til datamigrering i SAP miljøer - spar op til 50% på dine Data Migration udgifter

Affecto Denmark

Få et Data Warehouse (DW) review hos Affecto

Affecto Denmark

Ressourcehåndtering

Projectplace
  • Flere whitepapers

Branchenyheder

Ny chef for HP’s skandinaviske service- og outsourcingforretning

HP

HP udnævner Jakob Schou Meding som ny administrerende direktør for HP Danmark

HP

Konica Minoltas stand på drupa 2012 slog besøgsrekord

Konica Minolta Business Solutions Denmark

Komplex it er blevet Brocade Premier Partner

Komplex IT

Øg din effektivitet og produktivitet med bizhub C654/C754

Konica Minolta Business Solutions Denmark

Seneste debat

  1. HTML5 – det nye sort?

    12 comments.
    Last update 2 timer 19 minutter
    Skrevet af Kristian Dalgård
  2. Netflix bruger sit eget API 42 milliarder gange - om måneden

    2 comments.
    Last update 2 timer 56 minutter
    Skrevet af Martin Jensen
  3. Dart: Dynamisk Statisk Programmering

    20 comments.
    Last update 4 timer 27 minutter
    Skrevet af Lars Bjerregaard
  4. Microsoft fjerner umoderne bling-effekter i Windows 8

    49 comments.
    Last update 4 timer 41 minutter
    Skrevet af Jesper Lund Stocholm
  5. NemID sender Mac-styresystem fra 2009 ud i kulden

    31 comments.
    Last update 4 timer 45 minutter
    Skrevet af Jan Peter Bagge
  6. Clojure-opfinder fupper publikum med falske kodefakta

    2 comments.
    Last update 4 timer 52 minutter
    Skrevet af Allan Ebdrup
  7. Skulle du aldrig lave en WP app?

    33 comments.
    Last update 4 timer 54 minutter
    Skrevet af Lars Bjerregaard
  8. Meego-afløseren Tizen klar til at tage kampen op med Android

    3 comments.
    Last update 6 timer 45 minutter
    Skrevet af Bjørn Froberg

Mere debat »

It-virksomheder

Planahead
|
Rehfeld
|
Innologic A/S
|
Timelog
|
Inmobile
|
D60
|
NNIT
|
Cbrain
|
Twins Consulting
|
Contest
|
Incube
|
Mobile Advisor
 

Information

  • Kontakt redaktionen
  • Job- og annoncesalg
  • Teknisk support
  • Om Version2
  • Brugerbetingelser
  • Privatlivspolitik

Aktuelle emner

  • Agil udvikling
  • Android
  • Bruttolønsordning
  • Business Intelligence
  • Cloud computing
  • Download Windows 8
  • HTML5
  • Harddisk-priser
  • IE9
  • Intranet
  • It-sikkerhed
  • Kindle Fire
  • Multimedieskat
  • NemID
  • OS X Mountain Lion
  • Open source CMS
  • Projektledelse
  • Scrum
  • Sharepoint intranet
  • Storage
  • Ubuntu 11.10
  • Virtualisering
  • Windows 8
  • Windows Phone 7
  • iOS 5
  • iPhone 4S

Tjenester

  • Android-app
  • iPhone-app
  • RSS-feeds
Følg @version2dk
Tilmeld dig Version2's it-nyhedsbrev og vind den nye iPad.

Version2 udgives af

  • Mediehuset Ingeniøren A/S work Skelbækgade 4 1717 København V
  • Tlf. work 33265300