Du gætter aldrig, hvad denne nordmand fik et neuralt netværk til at gøre

Først ligner det vrøvl, men så sker der noget uventet. Eksperterne vil ikke have, at dette trick slipper ud!

Clickbait er internettets tveæggede sværd. På ene side hader vi clickbait-overskrifter, fordi vi sjældent ender med at tabe underkæben ved punkt 7, og på den anden side virker de efter hensigten, fordi millioner klikker på dem. Derfor rangerer clickbait lavere i anseelse blandt journalistiske produkter end sladderblade og tabloidaviser.

Så hvad er mere nærliggende end at lade en computer generere clickbait-overskrifter? Og vel at mærke ikke bare ved at lave tilfældige sammensætninger af clickbait-brudstykker. Den norske programmør Lars Eidnes besluttede sig for at pudse et neuralt netværk på sagen.

Nærmere bestemt valgte han at bruge et Recurrent Neural Network, hvor resultatet fra én udregning bliver brugt som basis for den næste. Det kan bruges til at opbygge sætninger, så de foregående ord bliver brugt til at udvælge det næste ord i sætningen.

Det Neurale netværk gennemløb to millioner overskrifter

Neurale netværk skal oplæres ud fra datasæt for at opbygge et regellag, og Lars Eidnes satte sit neurale netværk til at arbejde med to millioner overskrifter fra medier som Buzzfeed og Upworthy.

De første gennemløb gav dog ikke ligefrem resultater, der vil vippe de to clickbait-sider af tronen. Sådan lød ét af de bedste bud fra algoritmerne:

»Dr 5 Gameplay : Oscars Strong As The Dead«

Ligesom børn som regel skal kravle, før de kan gå, så bliver neurale netværk også bedre, jo mere erfaring de får. Efter den grundlæggende træning lød resultaterne mere overbevisende, som eksempelvis:

»Kate Middleton , Prince William & Prince George Leave Kate For The Queen«

Eller:

»Taylor Swift Becomes New Face Of Victim Of Peace Talks«

Derefter eksperimenterede Lars Eidnes med at tilpasse modellen og endte med at tage resultatet fra en træning med to lags gentagelse, hvor hvert ord var en 200-dimensionel vektor og lægge den ind i en model med tre lags gentagelse, men uden at ændre ordvektorerne.

Endelig var der blot mere træning af netværket tilbage, hvorefter Lars Eidnes konstruerede sit eget clickbait-site, som med jævne mellemrum spytter artikler ud. Når man klikker på én af clickbait-overskrifterne får man en artikel, som ligeledes er genereret af det neurale netværk, men resultatet er nok overraskende, men ikke som du ville tro.

Should We Stop Using The Word 'Double'?

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (20)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Jesper Stein Sandal

Jeg siger ikke, at nogen burde skaffe alle udgivne kommentarer på Version2.dk, og jeg siger heller ikke, at nogen burde hente koden til clickotron og træne den på Version2's debat, men jeg ville give thumbs up til alle Kommentarbots "First!1"-posts. ;)

  • 12
  • 2
Ditlev Petersen

For nogle (mange?) år siden var der en person, der ud fra en slags markov-kæder lod en bot skrive indlæg på diverse fora. De andre brugere kunne godt se, at noget var helt galt, men var usikre på, om det var et forsøg på at udvikle en kunstig intelligens - eller en komplet sindssyg person med et tastatur. Teksterne var i hvert fald sådan, at man hurtigt begyndte at skrige.
AI kan også stå for Artificial Insanity (som jeg vist skrev i en vrøvleartikel engang).

  • 3
  • 0
Kristian Wiborg

Jeg gættede det da jeg læse overskriften i mit RSS-feed på Netvibes, så mit spørgsmål er: Hvad har jeg vundet? Jeg skal måske indskyde at jeg nok kun har gættet det fordi jeg tidligere i dag læste om normanden på Slashdot :-)

  • 0
  • 1
Jarle Knudsen

Han burde tage et kigg på http://www.pakin.org/complaint/

:O)

Immoralism: It's the mantra that informs the beginning, middle, and end of every speech that Version2 delivers; the watchword of the ruthless urban guerrillas who conspire with evil; the poll-tested word guaranteed to resonate with dictatorial schizophrenics (especially the insolent type). As I'm sure you're aware, Version2 has been fighting hard to twist the teaching of history to suit its boisterous purposes. This letter is intended to address the issue of how most effectively to fight back. Our choice of strategy is critical because Version2's arguments are built on lies, and they depend on make-believe for their continuation.

If Version2 wants to create a mass psychology of fear about an imminent terrorist threat, let it wear the opprobrium of that decision. The problem as I see it is not a question of who the plotters of this society are but rather that Version2 is an inspiration to childish saboteurs everywhere. They panegyrize its crusade to besmirch the memory of some genuine historic figures, and, more importantly, they don't realize that failure to recognize this salient point will result in Version2's getting free reign to teach the next generation how to hate—and whom to hate. An obvious parallel from a different context is that people are not hostage to their identities. They have imagination, morality, principle, and a will to fight the warped, distorted, misshapen, unwholesome monstrosity that Version2's ideals have become. Most of all, they possess the knowledge that the problem with Version2 is not that it's unreasonable. It's that it wants to cause riots in the streets.

Version2's habitués always detect profound wisdom in what is most incomprehensible to them personally. Its surrogates probably don't realize that because it's not mentioned in the funny papers or in the movies. Nevertheless, if you hear Version2 spouting off about how it is an institution of morality, achievements, and noble qualities, one that often sacrifices its own reputation or safety in order to pursue that which is right and those things that truly matter, you should tell it that it is greatly increasing the size of its beer-guzzling coalition by needling and wheedling unsavory, morally crippled carpers into it. Better yet, tell it to stop getting its opinions from baleful misanthropes and start doing some research of its own. The point is that most people aren't willing to swallow what Version2 is serving up: a triple scoop of spleeny sprinkled with spleeny and topped off with warm spleeny sauce. Version2's disorderly monographs create and sustain inequality, hierarchy, and privilege. Am I aware of how Version2 will react when it reads that last sentence? Yes. Do I care? No, because it denies that this is one letter that it doesn't want you to read. This denial comes from a twisted belief that all it takes to start a rabbit farm is a magician's magic hat. And so Version2 closes its eyes, places its hands over its ears, and sings la-la-la to drown out any words of reason. Does anybody else feel the way I do, or am I alone in my disgust with Version2?

  • 3
  • 0
Robert Voje

så de foregående ord bliver brugt til at udvælge det næste ord i sætningen.

Dette er da taget direkte fra diskussionen på eb.
Jeg vil dog ikke kalde det et "Neuralt Netværk", heller et ... vel, mine ord vil nok blive censureret her, så jeg udelader dem.

  • 0
  • 0
Henrik Madsen

Har du nogensinde deltaget i en debat med den såkaldte teleanalytiker?

Tele-branche lobbyist er vist en mere rigtig betegnelse (En rigtig dårlig en af slagsen skal det så lige tilføjes).

Var det ikke ham som mente at Nokia stadigvæk var førende og at nokia's almindelige trykknap telefoner med Symbian S40 da bestemt var smart-phones og at Symbian S40/S60 var en reel konkurrent til Ios og Android. ?

  • 1
  • 0
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize