Drupal skal levere 60 mio. sidevisninger for bt.dk
Sidst på eftermiddagen tirsdag fik det tekniske hold bag dagbladet B.T.s website, bt.dk, avisens nye webplatform i luften. Dermed er et større skifte fra CMS-delen af avis-systemet Saxotech til open source-systemet Drupal en realitet for et af Danmarks mest besøgte websites.
Drupal benyttes i forvejen af en række andre avis-sites, herunder sporten.dk og erhvervsbladet.dk, der i lighed med B.T. er en del af Berlingske Media.
B.T. er med omkring 850.000 brugere og 60 millioner sidevisninger hver måned dog det hidtil største danske website baseret på Drupal.
Lige nu ligger der forskellige varianter af Drupal bag de forskellige Berlingske-sites, men det er planen, at alle Berlingske Medias websites skal køre på den nye Drupal-platform, som Berlingske Media selv har haft omkring 10 udviklere til at bygge.
»Det er første gang, vi laver et CMS-fundament, som alle Berlingskes sites skal over på. Det vil være den samme backend til alle sites, når de er flyttet over,« siger Bo Christensen, online-chef hos B.T.
Utilfredshed med Saxotech
Tilfredsheden med det tidligere Saxotech-system var til at overskue. Her var det især ydelsen, som lod meget tilbage at ønske. Berlingske Medias print-medier byggede på en tidligere version af Saxotech, og dermed gik huset glip af de forbedringer, som siden er kommet til.
Teknisk projektleder Jacob Bøegh fortæller, at det var erfaringerne med Berlingskes eksisterende Drupal-sites, som var baggrunden for valget. Herunder fleksibiliteten i forhold til, hvor nemt systemet kunne tilpasses, både i forhold til præsentationen og i forhold til indholdsleverandørernes brugerflader.
Men prisen på nul kroner for selve Drupal-softwaren var også én af parametrene bag valget af Drupal.
Et af succeskriterierne for Bo Christensen er flere brugere på sitet. Tidligere har det været et problem "breaking news", da der kunne gå 15 minutter, før en artikel var online. Det skal det nye system løse.
En bedre brugerflade for journalister og andre indholdsleverandører er også en faktor.
»Det kommer også til at betyde meget, hvor hurtigt det er at arbejde med. Det er i hvert fald ikke der, der ligger hindringer i vejen,« fortæller Bo Christensen.
Billigere end kommercielle hyldevarer
Det danske open source-system Typo3 var blandt de andre systemer, som Berlingske testede. Men det føltes ikke så nemt at arbejde med som Drupal, siger Jacob Bøegh.
Kommerciel hyldevare var en tredje mulighed. Men selv med de mere omfattende tilretninger, der typisk skal til med open source-produkter, kan Drupal snildt stå distancen.
Men også her var det på fleksibiliteten, at Drupal kunne slå de kommercielle rivaler. Det var især vigtigheden af at kunne dele indhold på tværs af sites, hvor de kommercielle programmer ikke rigtigt kunne være med.
»I forhold til de systemer, vi kiggede på, vurderede vi, at vi var længere fremme på mange områder,« siger Jacob Bøegh.
De store udvikleropgaver betyder også, at Berlingske Media næsten bliver et softwarehus, så længe projektet står på. Men den fase skulle være overstået i løbet af indeværende år. Derefter bliver udviklerne sat i gang med at skabe nye sites.
Kommentarer (11)
Der er videoer med introduktion til Drupal, samt introduktion til de basale Drupal-pakker cck og views på http://video.dku
ug.dk/2009-05-23-drupal/
måske skal man gøre lidt ved svartiderne.
en test på http://www.erhvervsbladet.dk/
giver en responsetid:
First byte received @ ms: 3999884281.63841 - deviation = 1365.9528670311
og http://www.bt.dk/ viser:
First byte received @ ms: 4000043081.73903 - deviation = 1759.4538640976
Altså langt over smertegrænsen(IMO).
Mu med fungerende url:
Der er videoer med introduktion til Drupal, samt introduktion til de basale Drupal-pakker cck og views på http://video.dkuug.dk/2009-05-23-drupal/
Drupal er et fedt produkt, tillykke med den nye løsning. Jeg har ikke målt svartiderne, men helt subjektivt synes jeg det går hurtigt (måtte lige fyre op under Internet Explorer grundet noget firefox/adblock inkombatibilitet ;))
Jeg håber Berlingske Media vil give lidt tilbage til fællesskabet når de nu også har nydt godt af det - vi kan altid bruge oversættelser af moduler eller andet godt.
Lidt mere linkdropping: http://drupaldanmark.dk/
Mine erfaringer med Drupal er, at systemets store fleksibilitet koster i form af performance. Meget af det kan selvfølgelig reddes af forskellige former for block cache, Memcache, Varnish, load balancing med mere, men helt grundlæggende er mit indtryk, at Drupal godt kan lide at belaste webserveren på grund af den fleksible hook-arkitektur og databaseserveren med mange databaseforespørgsler.
Måske nogle af de mange udviklere, der håndterer store danske Drupal-sites (dem er der efterhånden en del af) har erfaringer at byde ind med her?
I den kommende Drupal 7 er der forsøgt at tage hånd om dette ved blandt andet at skabe en helt ny databasestruktur for indhold, så systemet kan skalere til systemer med millioner af elementer, samt ved at have indbygget mulighed for at køre over flere databaseservere. Bedre performance er således højt prioriteret.
http://buytaert.net/starting-to-work-on-drupal-7
Netop derfor bliver det spændende at se, hvor hurtigt de dygtige folk i Berlingske kan få deres nye sites (på Drupal 6) til at reagere. Ifølge Yslow (http://developer.yahoo.com/yslow/) oplever jeg lige nu svartider på mellem 5 og 10 sekunder på artikler på bt.dk, så der er vist plads til forbedring.
Og i øvrigt tillykke med det nye bt.dk - jeg synes, det er blevet flot.
Til sidst: Husk at vi også har en Drupal-gruppe her på Version2, du kan melde dig ind i.
http://www.version2.dk/grupper/drupal/
Jeg føler virkelig at der er kog i Drupal gryden for tiden. Vi har rigtig mange kunder der efterspørger Drupal løsninger og som har hørt godt om det, og det er jo en blåstempling når store foretagner som Berlingske ruller Drupal ud i så stor stil.
At det så lader til at være gået lidt hurtigt ifbm. bt.dk er så en anden sag, men de design ting får de vel snart fikset.
Men også inden for det offentlige sker der ting - vi er fx ved at udskifte Københavns- og Århus' Bibliotekers hjemmesider fra bl.a. Plone til Drupal - et stort og meget spændende projekt (jeg har skrevet lidt om det her: http://www.signaldigital.com/2009/05/20/update-pa-ting-projektet/)
Og det bliver et ægte opensource system som jeg regner med bliver rullet ud på mange af de mindre biblioteker hvis de ønsker det.
Spændende udvikling og tillykke til Berlingske!
Jeg tror jeg vil refase det til:
afvejning mellem 'performance og økonomi'
Det er ikke så lang tid siden jeg så en artikel her på V2, hvor Google fortalte at en ekstra svartid på 500 mS betød 20% nedgang, og noget med Amazon mistede salg af samme årsag.
Økonomi -
Jo man kan fokusere på suboptimering, så det er billigst muligt at eksponere, men hvis man mistaer mange læsere (og formentlig annonceindtægter), hvor er så økonomien?
En forøget svartid gør vel, at man søger over på eks. politiken, eller andet.
Trods alt er det næsten de samme nyheder de bringer.
(Jeg har intet med branchen at gøre, men think about IT).
Ja, jeg er bevidst om, at folk ikke går op i performance, men jeg kan alligevel ikke undlade at bemærke de 'lidt mange' server requests, der ligger i bt's side:
<!-- Framework CSS -->
<link type="text/css" rel="stylesheet" media="all" href="/sites/all/modules/quotes/quotes.css?2" />
<link type="text/css" rel="stylesheet" media="all" href="/sites/all/modules/sphinxsearch/sphinxsearch.css?2" />
<link type="text/css" rel="stylesheet" media="all" href="/sites/all/modules/panels/css/panels.css?2" />
<link type="text/css" rel="stylesheet" media="all" href="/sites/all/modules/panels/layouts/bt_twelwecol_frontpage/bt_twelvecol_frontpage.css?2" />
<link type="text/css" rel="stylesheet" media="all" href="/sites/all/modules/panels/layouts/bt_mini_twocol/bt_mini_twocol.css?2" />
<link type="text/css" rel="stylesheet" media="all" href="/sites/all/modules/panels/layouts/onecol/onecol.css?2" />
<link type="text/css" rel="stylesheet" media="screen, projection" href="/sites/all/themes/bt/blueprint/screen.css?2" />
<link type="text/css" rel="stylesheet" media="screen, projection" href="/sites/all/themes/bt/blueprint/plugins/fancy-type/screen.css?2" />
<link type="text/css" rel="stylesheet" media="screen, projection" href="/sites/all/themes/bt/stylesheet.css?2" />
<link type="text/css" rel="stylesheet" media="print" href="/sites/all/themes/bt/blueprint/print.css?2" />
<!--[if lte IE 7]><link rel="stylesheet" href="/sites/all/themes/bt/blueprint/ie.css" type="text/css" media="screen, projection" /><![endif]-->
<!--[if IE 6]><link rel="stylesheet" href="/sites/all/themes/bt/blueprint/ie6.css" type="text/css" media="screen, projection" /><![endif]-->
<!--[if IE 6]><link rel="stylesheet" href="/sites/all/themes/bt/ie6.css" type="text/css" media="screen, projection" /><![endif]-->
<!-- Javascript -->
<script type="text/javascript" src="/misc/jquery.js?2"></script>
<script type="text/javascript" src="/misc/drupal.js?2"></script>
<script type="text/javascript" src="/sites/default/files/languages/da_f05381dbc54091c2620633cda69ccdd3.js?2"></script>
<script type="text/javascript" src="/sites/all/modules/panels/js/panels.js?2"></script>
<script type="text/javascript" src="/sites/all/modules/tns/tmv11.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/jquery.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/scripts.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/jquery.tickertype.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/jquery.corner.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/jquery.jcarousel.pack.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/jquerypngfix.js?2"></script>
<script type="text/javascript" src="/sites/all/themes/bt/jquery/swfobject.js?2"></script>
Bemærker også, at der er 2x kald til jQuery.
I øvrigt, så er svartiden for version2.dk herfra:
First byte received @ ms: 4084252411.79729 - deviation = 75.9388718605042
og 'søsteren' ing.dk:
First byte received @ ms: 4084372561.50873 - deviation = 103.452744960785
Ja, disse Adservere fordelt over en masse lande, stopper trafikken, og vi skal side og vente på f.eks adtech.de før siden dukker op.
Det ville aldrig gå i en biograf.
I forbindelse med nogle diskussioner om performance o. lign. tjekkede jeg lige berlingske.dk, og bt.dk
I skrivende stund får man en response fra en IIS 6 server hvis man kalder berlingske.dk:
HTTP/1.1 200 OK
Date: Wed, 08 Jul 2009 09:11:21 GMT
Server: Microsoft-IIS/6.0
ServedBy: web004
Content-Type: text/html
Set-Cookie : PBCSPERMUSERID=473359640280882; expires=Thursday, 08 Jul 2010 11:11:20 GMT; path=/;
Content-Length: 196256
Set-Cookie: PBCSSESSIONID=473359640280882; path=/
Keep-Alive: timeout=5, max=97
Connection: Keep-Alive
Set-Cookie: NSC_WJQ_cfsmjohtlf=440ccd583660;path=/
Har man droppet Drupal?
Responsetime har da også forbedret sig, da den nu er:
First byte received @ ms: 1511501386.6976 - deviation = 25.8385310173035
Ved nærmere eftersyn kan jeg godt se, at artiklen kun handler om bt.dk, og ikke berlingske.dk, så jeg tager nok fejl.
Men et spørgsmål: Hvad bruger berlingske.dk, siden der er IIS-drevet?
Drupal kan sagtens køre på IIS. Hvorfor skulle det ikke kunne det?
Men jeg tror nu stadigvæk Berlingske.dk kører på Saxotech - den er ikke skiftet endnu.

