Titta

UR Samtiden - Future friday

UR Samtiden - Future friday

Om UR Samtiden - Future friday

Föreläsningar från Future Friday 2014, om ny och framtida teknik. Föreläsningar om bland annat big data, den mobila utvecklingen, sociala medier, miljövänliga kommunikationssystem och elektronikforskning på Venus. Inspelat den 7 mars 2014 vid Institutionen för data- och systemvetenskap i Kista, Stockholm. Arrangör: Kungliga tekniska högskolan och Stockholms universitet.

Till första programmet

UR Samtiden - Future friday : Algoritmer och sociala nätverkDela
  1. Tack, Emelie. Jag heter Nima-

  2. -och jag ska prata om vår forskning
    här på KTH om sociala nätverk.

  3. Ni har säkert
    flera konton på olika nätverk-

  4. -som Facebook, Twitter,
    Linkedin, Instagram, och så vidare.

  5. Men det kan vara intressant
    att veta vilken sorts programvara-

  6. -man använder i de här systemen.

  7. Jag ska fokusera på en särskild sort:
    rekommendationssystem.

  8. Jag börjar med att gå igenom
    vad jag ska tala om.

  9. Jag ska förklara
    vad ett rekommendationssystem är.

  10. Vilka typer av exempel finns det?
    Ni har säkert redan stött på dem-

  11. -vilket hjälper er att förstå.

  12. Vilka saker är intressanta
    för forskare att analysera?

  13. Sen ska jag tala om fördelarna med
    att använda data från sociala nätverk.

  14. Vilka fördelar
    ger data från nätverken oss?

  15. Sen ska jag visa lite av vår forskning-

  16. -särskilt hur förtroende kan ge
    bättre rekommendationer-

  17. -och hur man skyddar
    användarnas integritet.

  18. Slutligen går jag in på specifika
    sorters rekommendationssystem-

  19. -som man har på sajter
    som Twitter och Tripadvisor-

  20. -och hur man tar reda på
    vad folk tycker.

  21. Den här sortens system-

  22. -utgår från en väldig massa data.

  23. Facebook behandlar
    enligt inofficiella uppgifter-

  24. -4,7 miljarder statusuppdateringar.

  25. Det är mycket för datorer att hantera.

  26. Twitter behandlar fler än 200 miljoner
    tweet per dag. Det är också mycket.

  27. För att systemen ska kunna hitta
    intressanta saker åt en-

  28. -måste de ha nån form av algoritmer-

  29. -som kan gå igenom uppdateringar, tweet,
    foton och så vidare-

  30. -och välja ut dem som passar en bäst.

  31. Det här är en rekommendation,
    och effekten kallas personalisering.

  32. Man skapar ju profiler överallt i dag.

  33. Man har profiler
    på Facebook, Twitter och Instagram.

  34. Det man gör sparas-

  35. -och algoritmerna
    använder informationen-

  36. -för att välja ut de uppdateringar som
    ska passa en. De är personaliserade.

  37. Det är det här
    som vi kallar för rekommendationer.

  38. Det finns tre sorters rekommendations-
    system. Ett är det innehållsbaserade.

  39. Föremål som påminner om varandra.

  40. Om man söker på böcker
    får man förslag på liknande böcker.

  41. Innehållet påminner alltså
    om vad man har tittat på eller köpt.

  42. Den andra sorten är social filtrering.

  43. Den här ligger nära sociala nätverk.

  44. Systemet letar efter användare
    som har agerat som en själv-

  45. -som t.ex. har betygsatt samma filmer.

  46. Sen väljer de ut de filmer
    som den användaren har tittat på.

  47. Vi har även i dag en hybridform.

  48. Man blandar det som man har tittat på,
    betygsatt eller sökt efter-

  49. -och det
    som liknande användare har gjort.

  50. Till slut det intressantaste.
    Här ser ni rekommendationssystem-

  51. -som ni säkert har stor erfarenhet av.
    Vi börjar med Google.

  52. Om man skriver nåt i sökrutan
    kommer Google med förslag.

  53. Jag har sökt på
    "datautvinning på sociala nätverk"-

  54. -och sen ser man
    utökade förslag på sökningen.

  55. Ett nämner säkerhetsinformatik-

  56. -och ett nämner
    nåt med personaliserade mejl.

  57. Säkerhet är alltså nåt
    som jag har sökt på tidigare.

  58. Personalisering har jag sökt på
    tidigare, vilket Google vet.

  59. De går igenom tidigare sökningar,
    och det här förslaget baseras på dem.

  60. Det är ett innehållsbaserat
    rekommendationssystem.

  61. Amazon har också
    ett intressant system.

  62. Jag har sökt på en bok
    om rekommendationssystem.

  63. Längst ned ser man vilka andra böcker
    som köparna av den boken har köpt.

  64. Och de påminner om min bok.

  65. Det här är också
    ett innehållsbaserat system.

  66. På Tripadvisor
    har jag sökt på Novotel Hotel i Paris-

  67. -och sen blir jag föreslagen
    andra Novotel-hotell i Paris.

  68. Den rekommenderar mig alltså
    exakt vad jag har sökt på.

  69. Sen har vi Netflix,
    där man betygsätter filmer.

  70. Man betygsätter filmer som man har sett,
    och systemet bearbetar datan.

  71. Sen kommer det med filmförslag utifrån
    dina betyg.

  72. Det här är ett användarbaserat system.

  73. Det viktigaste fallet för vår forskning
    kommer från Facebook.

  74. De här sidorna får jag som förslag.

  75. Det är till exempel
    kändisar på Facebook.

  76. En av mina vänner
    plus tolv till har gillat den.

  77. Jag får den
    eftersom mina vänner har gillat den.

  78. Jag får även Ikea Sverige föreslagen-

  79. -eftersom en vän har gillat deras sida.

  80. De här förslagen
    kommer från mitt nätverk.

  81. Hur är det med andra,
    som "Mean Streets" eller den ovanför?

  82. Varför blir jag föreslagen dem?

  83. Här kan det röra sig om en blandning av
    andra användare och innehåll...

  84. ...som mitt nätverk varit inne på.

  85. Jag ska ge er några konkreta
    systemexempel som vi tittar på.

  86. Först har vi Facebook-exemplet.
    Förklara rekommendationen för mig.

  87. Jag förstår inte varför jag får
    just den här sidan rekommenderad.

  88. Varför blir jag föreslagen den
    om inte mina vänner har gillat den?

  89. Man försöker förbättra algoritmerna
    för att visa oss logiken-

  90. -och att vi får förslagen
    av en särskild anledning.

  91. Man gör systemet mer transparent.

  92. Rekommendationssystem
    behöver mycket data.

  93. De funkar bättre
    när man avslöjar mycket om sig själv.

  94. De får aldrig nog av data.
    Men man vill inte avslöja för mycket.

  95. Man vill inte visa hur mycket tid
    man lägger på olika sajter.

  96. Det gäller att ge bara så mycket
    att systemet fungerar ordentligt.

  97. Går det att hitta nån kompromiss-

  98. -så att man bara ger data så det räcker
    för systemet? Det forskar vi också om.

  99. Mångfald och nyheter.
    Systemen föreslår liknande saker-

  100. -och fortsätter i samma hjulspår.

  101. Ge mig nya saker! Varför får jag
    ständigt se samma sorts sidor?

  102. Jag vill uppleva
    nya saker och nya människor.

  103. Det här är ett problem.

  104. Sociala nätverk, särskilt de
    som finns på nätet, blev populära-

  105. -och ju mer data de visade-

  106. -desto lättare blev det för forskarna
    att ta itu med problemen.

  107. Vi har alltså två sorters förhållanden.

  108. Vi har de uttalade,
    de som man visar på nätverken:

  109. Man är vänner med de här på Facebook och
    följer de där på Twitter.

  110. Vi har även de outtalade, alltså
    förhållanden som inte är synliga-

  111. -men som kan räknas på. Om
    två personer gillar samma filmer-

  112. -kan jag hitta samband mellan dem-

  113. -vad gäller filmsmaker.

  114. Vi kan analysera alla de här
    förhållandena och utnyttja dem.

  115. Men vilka fördelar får vi av
    att utnyttja förhållandena i nätverk?

  116. Först och främst
    är förhållandena dokumenterade.

  117. Om man har visat
    att man litar på nån i nätverket...

  118. Om jag vet att du litar
    på nån som recenserar hotell...

  119. ...och ger honom bra betyg
    på Tripadvisor, Yelp...

  120. ...eller Amazon, kan jag använda det.

  121. Om du följer en politiker eller kändis
    på Twitter eller Facebook...

  122. ...kan jag utnyttja
    ditt intresse för personen i fråga.

  123. En bra sak med sociala nätverk-

  124. -är att kampen mot spammare
    och falska konton har blivit lättare.

  125. För man lägger inte till
    spammare till sitt nätverk.

  126. Man lägger inte till nån
    som kommer med falsk information-

  127. -utan man lägger till
    människor som man känner.

  128. Vi har även det här med kallstarter, som
    bilar som har svårt att starta.

  129. Systemen funkar inte
    när de inte har nog med data.

  130. Men i nätverken
    har man alltid människor-

  131. -som med sina data
    får systemen att fungera.

  132. Det är vad nätverken bidrar med när det
    gäller att göra rekommendationer.

  133. Jag vill visa lite av vår forskning,
    så att ni förstår vad vi sysslar med.

  134. Först vill jag visa hur vi tittar
    på förtroende mellan personer.

  135. Baserat på intresse
    som personer delar för filmer...

  136. ...eller annat som de delar online
    så kan vi räkna fram nån typ av...

  137. ...siffra över hur mycket
    de här personerna litar på varandra.

  138. Sen använder vi den
    för att förbättra rekommendationerna.

  139. Vi kan bygga bättre rekommendations-
    system än de som finns online.

  140. Jag ska visa hur vi bygger nätverken.
    Men först några bilder.

  141. Det är så här vi åskådliggör nätverken.
    Det här är från recensionssajten Ciao.

  142. Ni ser strecken mellan punkterna.

  143. Punkterna är människor. Jag hoppas att
    de olika färgerna underlättar.

  144. Strecken visar
    hur de litar på varandra.

  145. Vi försöker hitta de personer
    som ses som särskilt trovärdiga-

  146. -och de som ingen litar på.
    Vi analyserar det rent visuellt också.

  147. Hur bygger vi såna här förtroende-
    nätverk om vi inte har några?

  148. Säg att vi har era betyg från Netflix.
    Vi samlar alla betyg-

  149. -och försöker bygga ett nätverk,
    som vi ser här uppe.

  150. Med våra förtroendesiffror räknar vi ut
    hur betygen sätts för filmer.

  151. Om man har gett filmer
    samma betyg som nån annan-

  152. -så vill man nog få rekommendationer
    från den personen-

  153. -eftersom man delar smak.

  154. Sen räknar vi, och får fram
    ett nätverk som ser ut så här.

  155. Vi får ett förtroendenätverk.
    Utifrån nätverket beräknar vi-

  156. -vilken sorts betyg
    folk kan tänkas sätta-

  157. -och vi kan jämföra
    med redan satta betyg.

  158. Det här visar hur bra
    våra rekommendationer blir.

  159. Vi kan också titta på
    hur folk litar på varandra.

  160. Nätverket till vänster har vi byggt upp
    utan att titta på förtroende.

  161. Det handlar om vad folk har gillat,
    och att de följer varandra.

  162. Det här baseras på data om filmer,
    nästan som Netflix.

  163. I nätverket till höger
    har vi tagit hänsyn till förtroende.

  164. Ser ni skillnaden mellan de båda?

  165. På den till höger
    ligger tyngdpunkten i centrum.

  166. Det är fler prickar i mitten.

  167. Vår algoritm har lyckats hitta
    förtroendeingivande användare-

  168. -och hänvisa andra användare till dem.

  169. Men vi kan identifiera dem
    och berätta vad de är experter på-

  170. -så att folk
    kan ta emot rekommendationer.

  171. Det här är ett visuellt exempel,
    men vi gör även rena räkneexempel.

  172. De här två graferna visar oss
    hur exakta rekommendationerna blir.

  173. Ju större förtroendenätverket är,
    till höger-

  174. -desto tillförlitligare är algoritmen.

  175. Till höger ser vi att ju större nätverk,
    desto fler kan få rekommendationer.

  176. Mängden data
    är som sagt alltid ett problem.

  177. Så med statistik kan vi se
    hur väl vår algoritm fungerar.

  178. Samtidigt kan vi jämföra
    med andra tillvägagångssätt.

  179. I den här bilden
    har vi jämfört tre olika sätt.

  180. Till vänster
    jämför vi oss med O'Donovan.

  181. Både vad gäller precision
    och täckning överträffar vi honom.

  182. Så vi kan titta på våra värden-

  183. -och jämföra dem
    med andra från olika källor.

  184. Det här var lite om
    hur vi forskar om förtroende-

  185. -och hur vi kan förbättra
    rekommendationerna.

  186. Jag nämnde personlig integritet,
    och det handlar om kontroll.

  187. Man vill kunna styra
    mängden data som man ger systemet-

  188. -men samtidigt vill man ha
    bra rekommendationer i utbyte.

  189. Går det att hitta nån sorts kompromiss-

  190. -där man kan styra över sina data-

  191. -men ändå ha fungerande
    rekommendationssystem?

  192. Det här har vi föreslagit för mjukvaru-
    arkitekter som kan ändra algoritmer.

  193. De gråa boxarna
    är formler och algoritmer-

  194. -som vi har lagt in
    i rekommendationssystemet.

  195. Här lägger vi till mer integritet.

  196. Vi skyddar datan när den används-

  197. -men ser samtidigt till
    att systemet fungerar.

  198. För om vi tar bort för mycket data
    fungerar inte systemet ordentligt.

  199. Precis som i tidigare exempel
    kan vi jämföra och visa-

  200. -att vi står oss väl jämfört med andra
    metoder men värna om integriteten.

  201. De röda och gula strecken
    är andra metoder-

  202. -och det blåa vårt. Oftast
    gör vi bättre ifrån oss än de andra.

  203. Vi har analyserat integriteten
    i förtroendenätverk.

  204. Nu ser vi nyare sorters data
    på Twitter och recensionssajter.

  205. Folk har börjat ladda upp texter.

  206. Facebookuppdateringar och
    hotellrecensioner är exempel på det.

  207. Vi behöver metoder
    som fungerar på sån här data.

  208. Vi vill förstå hur vi kan få folk
    att gilla olika saker-

  209. -så att det inte jämt
    blir samma rekommendationer.

  210. Vi vill även se om vi kan rekommendera
    tweet till användare-

  211. -bättre än vad Twitter gör.

  212. Jag har lagt upp en recension
    till vänster av ett flygbolag-

  213. -som nån har skrivit på nätet.
    Han var nöjd och gav bra betyg.

  214. Han gav fyra stjärnor av fem.

  215. Det finns förstås negativa omdömen
    också, men det här är positivt.

  216. Här ser vi en ämnesmodell.

  217. Det är den modell som Twitter har
    för att föreslå nya användare att följa.

  218. Vi använder den för att få en
    ämnesbaserad bild av folks omdömen.

  219. Vi har 900 recensioner
    och skapar en ämneskarta-

  220. -som visar vad folk
    har tyckt om det här flygbolaget.

  221. Då kan vi visa om omdömena
    har varit positiva eller negativa.

  222. Till exempel har vi
    för fyra produkter kunnat visa-

  223. -att om folk har varit nöjda med
    produkterna har de gett höga betyg-

  224. -och om de har sagt dåliga saker-

  225. -har de följaktligen gett låga betyg.

  226. De gröna och blåa
    är positiva omdömen-

  227. -medan orangea och gula
    är negativa omdömen.

  228. Vi kan analysera om vi lyckas få
    varierade omdömen-

  229. -och betyg
    på till exempel recensionssajter.

  230. Kan vi göra samma sak med Twitter?

  231. Här ser ni två moln
    av ämnen som vi har extraherat-

  232. -från två trender 2011.

  233. Vi hade bland annat eurokrisen-

  234. -och det
    var det många som twittrade om.

  235. De här ämnena
    har diskuterats mycket.

  236. De är stora, och sen har vi lite mindre.

  237. Nationalekonomi,
    bailout och euro-USD.

  238. Det sista
    handlar om kursen mot dollarn.

  239. Många tweet nämner kursen
    eftersom ekonomin påverkades.

  240. Bara genom att titta på molnet-

  241. -förstår vi mycket av
    vad tweeten har handlat om.

  242. Det lägre handlar om Wikileaks,
    och ännu vanligare är-

  243. -att det gäller Julian Assange.

  244. Om man går lite lägre ser man
    taggar om terrorism och Mubarak-

  245. -så vi ser att folk som har pratat
    om till exempel Wikileaks-

  246. -även har följt andra händelser,
    för det här är deras tweet.

  247. Så genom att ta fram
    såna här ämneskartor-

  248. -kan vi lära oss mycket.

  249. Och de hjälper oss
    att rekommendera användare.

  250. Vi har använt olika metoder
    för att rekommendera...

  251. ...användare baserat på ämneskartorna
    som vi skapar med deras tweet.

  252. Sen ser vi
    hur bra de olika metoderna fungerar.

  253. Det här var vad jag hade att ta upp-

  254. -och jag avslutar med att säga-

  255. -att om ni är intresserade av data-
    analys och rekommendationssystem-

  256. -så kallas det här
    data science och big data.

  257. Det här är två populära områden inom
    både forskning och näringsliv just nu.

  258. Det finns jobb inom dem,
    och många företag letar efter folk-

  259. -som kan analysera data
    från sociala nätverk-

  260. -och skapa algoritmer
    som kan hantera sån data.

  261. KTH
    och andra europeiska institutioner...

  262. ...föreslår program
    som ska lära ut data science...

  263. ...och även big data,
    så förhoppningsvis är det på gång.

  264. Tack så mycket.

  265. Har vi några korta frågor?

  266. Känner du till Facebooks poke-system?

  267. -Poke-systemet.
    -Ja.

  268. Man kan se det som ett sätt att flörta
    med andra Facebook-användare.

  269. Hur fungerar förslagen där?

  270. Har det att göra med vilka vänner
    man har och vilka bilder man gillar?

  271. Poke-systemet...

  272. Om man puffar andra
    gissar jag att systemet föreslår fler-

  273. -än om man inte gör det.

  274. Jag vet inte exakt
    hur algoritmen funkar-

  275. -men den lär tillhöra en av
    kategorierna som jag har tagit upp.

  276. Översättning: Markus Svensson
    www.btistudios.com

Hjälp

Stäng

Skapa klipp

Klippets starttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.

Klippets sluttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.Sluttiden behöver vara efter starttiden.

Algoritmer och sociala nätverk

Produktionsår:
Längd:
Tillgängligt till:

Nima Dokoohaki, forskare i informations- och kommunikationsteknik, berättar om vad man kan se genom att studera sociala nätverk. Vad händer när vi skapar profiler och vad lämnar vi för information om oss själva? Inspelat i mars 2014 vid Institutionen för data- och systemvetenskap i Kista, Stockholm. Arrangör: Kungliga tekniska högskolan och Stockholms universitet.

Ämnen:
Information och media > Internet och digitala medier, Teknik > Kommunikations- och informationsteknik
Ämnesord:
Forskning, IT, Informationsteknik, Sociala medier
Utbildningsnivå:
Gymnasieskola

Alla program i UR Samtiden - Future friday

Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Future friday

Algoritmer och sociala nätverk

Nima Dokoohaki, forskare i informations- och kommunikationsteknik, berättar om vad man kan se genom att studera sociala nätverk. Inspelat i mars 2014. Arrangör: Kungliga tekniska högskolan och Stockholms universitet.

Produktionsår:
2014
Utbildningsnivå:
Gymnasieskola
Beskrivning

Mer gymnasieskola & information och media

Spelbarhet:
UR Skola
Längd
Titta Sittstrejken

Medierna

Ung i Sverige utnyttjar sociala medier på ett effektivt sätt för att nå ut med budskapet om sittstrejken och väcka opinion mot utvisningarna till Afghanistan. De traditionella medierna hakar på, och får snart fokus på den 17-åriga tjejen som står längst fram. Fatemeh Khavari är en av två talespersoner men det är henne medierna lyfter fram. När intresset för strejken börjar dala sker en knivattack på andra sidan torget som åter får medierna till platsen.

Spelbarhet:
UR Skola
Längd
Lyssna Kjellkritik

Användning av källor

Om kraften i filmmediet och hur svårt det är att vara källkritisk. Kjell Eriksson träffar filmrecensenten och kulturjournalisten Fredrik Sahlin som funderar över detta. Kjell träffar också Anna Davidsson som är profilen bakom Instagramkontot "Apan satt i granen". Hon berättar om ansvaret och påverkan man har som kommer med en stor följarskara. Reportern Josefiné försöker göra en egen fake-video. Ser någon igenom bluffen?