Titta

UR Samtiden - Demokrati i en digital era

UR Samtiden - Demokrati i en digital era

Om UR Samtiden - Demokrati i en digital era

Föreläsningar från föreläsningsserien Public Domain and Democracy in the Digital Age vid Uppsala universitet. Internationella forskare diskuterar frågor om lagar och regelverk i den digitala världen. Vad händer när stater och regeringar får konkurrens av privata företag när det gäller att diktera reglerna i den digitala världen? Inspelat den 18-19 september 2014. Arrangör: Uppsala universitet.

Till första programmet

UR Samtiden - Demokrati i en digital era : Så används big dataDela
  1. Titeln på presentationen är "Åtkomst
    och användning av big data"-

  2. -"epistemiska, etiska
    och politiska implikationer."

  3. Jag vill ta upp-

  4. -varför stora datamängder är ett
    viktigt ämne för den här konferensen.

  5. Sen vill jag diskutera big data,
    vilka det rör och hur det används.

  6. Sen går jag till utvärdering av big
    data och försöker koppla ihop-

  7. -epistemologi, etik och politik.
    Jag ska snart ge ett exempel.

  8. Frågor om åtkomst och användande-

  9. -tydliggör
    många av problemen med big data.

  10. Sist ska jag nämna
    hur man kan syssla med-

  11. -och hur man kan påverka
    användningen av big data.

  12. Jag ska visa
    varför jag fokuserar på epistemologi-

  13. -för det är inte det första
    man associerar med big data.

  14. Vissa har nog hört
    den här historien från 2012.

  15. Den lyder så här:

  16. En pappa ringer Targets kundtjänst
    och klagar över-

  17. -att han har fått kuponger
    för graviditetsrelaterade produkter.

  18. Han sa: "Ingen i familjen är gravid.
    Vad ska vi med kupongerna till?"

  19. Det var det första steget.

  20. Personen från kundtjänst ringde sen
    tillbaka för att be om ursäkt-

  21. -men då sa fadern:

  22. "Vi hade en kommunikationsmiss
    i familjen. Min dotter är gravid."

  23. Hur visste de det?
    Jo, genom kundens köpmönster.

  24. Varför är då det här ett problem?

  25. Rent etiskt
    är det en fråga om integritet.

  26. Handlar det om
    otillåten tillgång till data?

  27. Eller gav man medgivande när man
    använde ett kundkort som loggas-

  28. -i utbyte mot kuponger?

  29. Integriteten har inte kränkts
    genom insamlingen av data-

  30. -utan genom hur man använde
    denna data.

  31. Jag tolkar big data-användning
    som användning av kunskap-

  32. -med etiska, juridiska och politiska
    följder.

  33. Det är inte själva datainsamlingen
    som är problematisk.

  34. Enkla föreställningar
    om medvetet medgivande-

  35. -kanske inte räcker för att tackla
    vissa utmaningar med big data.

  36. Man måste gå in på
    big data-användningen i detalj-

  37. -för att förstå vad som pågår.

  38. Det är därför
    jag vill fokusera på epistemologin.

  39. Varför big data?
    Jag tog det här från broschyren-

  40. -om offentlig information
    som kulturell dataresurs-

  41. -som är fri att använda-

  42. -för att sprida information
    och fatta beslut.

  43. Ersätter man "information" med "data"
    blir inte förändringen så stor.

  44. "Data" är kulturella, administrativa
    och vetenskapliga data-

  45. -som kan användas fritt.

  46. Vi har även problemet
    med tillgänglighet och åtkomst.

  47. Det handlar om kompatibilitet
    och formateringskostnader-

  48. -för att göra den tillgänglig.

  49. Man kan använda data för att skaffa
    sig kunskap inför beslutsfattande.

  50. Man har länge använt data för att
    rättfärdiga administrativa beslut-

  51. -vilket Ted Porter nämner
    i "Trust in Numbers".

  52. Därför tycker jag att det är ett
    viktigt ämne för den här konferensen.

  53. Mellan offentlig och privat data
    finns en spänning.

  54. Det medför faror,
    men även demokratiska möjligheter-

  55. -beroende på vilken data
    som finns var.

  56. En av de viktigaste frågorna är den
    om åtkomst och användning.

  57. Vad är då big data?

  58. En definition som har förespråkats av
    Mayer-Schönberger och Cukier är-

  59. -"mer data och luddig data".

  60. Man brukar även ha med ett tillägg-

  61. -om att korrelation väger tyngre
    än kausalitet i big data.

  62. Det är ett påstående om big data.

  63. Rob Kitchin har gett
    en mer detaljerad definition.

  64. "Big data har stora volymer,
    ett snabbt flöde"-

  65. -"är varierad, omfattande,
    högupplöst och relationell"-

  66. -"och kan ha drag av extensionalitet
    och skalbarhet."

  67. Det går in mer i detalj
    på vad big data innebär.

  68. Vi kan också skilja på
    olika typer av big data.

  69. Debatten om big data-

  70. -har en koppling
    till användning av sociala medier.

  71. Vi har explicit data som kommentarer,
    likes, sökord och uppladdat material.

  72. Det finns även implicit data-

  73. -som plats, sidbesök, klick o.s.v.

  74. Det är användardata
    från sociala medier.

  75. Sen har man transaktionsdata,
    som visar vad man köper var-

  76. -och platsdata,
    som främst kommer från mobilen.

  77. Sen har vi även olika sensordata
    och "internet of things".

  78. När man talar om
    det offentliga området-

  79. -har vi folkbokföringsdata-

  80. -och uppgifter om föräldrarnas namn,
    födelseort, födelsedatum-

  81. -adress, yrke och personnummer.

  82. Jag har flyttat till Köpenhamn,
    och där är personnumret viktigt.

  83. Jag hade inte fattat
    hur viktigt det kunde vara.

  84. Herman Tavani
    har gjort en bra distinktion-

  85. -mellan ickeoffentlig och offentlig
    persondata.

  86. Den förstnämnda är medicinsk
    och ekonomisk information.

  87. Den andra är var man jobbar,
    var man gick i skolan, o.s.v...

  88. Den förstnämnda har mycket mer
    begränsad användning.

  89. Big data finns även inom vetenskapen-

  90. -inom allt från astronomi, fysik,
    biologi och så vidare.

  91. Medicinsk data är ett enormt fält.

  92. Man pratar nu om att slå ihop
    alla dessa former av data-

  93. -för att försöka se nya mönster
    i dessa enorma mängder data.

  94. Det är vad big data är.

  95. Den andra frågan är
    vilka som utnyttjar big data.

  96. I det här citatet från Lev Manovich
    gör han en intressant kategorisering.

  97. "Människor och organisationer
    delas in i tre kategorier."

  98. "De som skapar data, både medvetet
    och genom digitala spår"-

  99. -"de som kan samla in den,
    och de som kan analysera den."

  100. Åtkomst och användning...

  101. Vi ser en uppdelning
    mellan leverantörer, insamlare-

  102. -och analytiker.

  103. Vi kan gå in djupare
    på vilka som samlar in data.

  104. Jag tänker ta det i stora drag-

  105. -för man kan lätt snöa in på vilka
    statliga aktörer som är inblandade.

  106. Jag skiljer på företag, stat,
    vetenskapen och användarna.

  107. Det är grova kategorier
    över vilka som samlar in data.

  108. Beroende på vem som samlar in den-

  109. -får man olika funktioner
    och implikationer.

  110. Jag ska gå igenom vad som händer
    inom de olika områdena-

  111. -och vilka skillnader man ser.

  112. Jag börjar med "användarna".
    De har en begränsad roll.

  113. De kanske använder mobiltelefoner,
    smartklockor eller annat.

  114. De kan samla in data
    om sin sömn och hälsa-

  115. -så de är till viss del
    insamlare och analytiker.

  116. Men de förser företagen med data
    som dessa sen kan använda.

  117. "Datainsamling" ger associationer
    till Google och Facebook-

  118. -men de är inte ensamma.
    Man måste tänka på all datainsamling.

  119. Det kan vara företag
    man aldrig har hört talas om-

  120. -som spårar en i bakgrunden.

  121. Jag ska ta ett exempel
    i frågan om metadata.

  122. Jag utgår ifrån en föreläsning som
    Thomas Hoffmann höll-

  123. -på "Die Vermessung des
    Menschen"-konferensen i maj.

  124. Den hette
    "Den digitala datans hermeneutik".

  125. Han är professor i datavetenskap,
    har jobbat på Google-

  126. -och har en examen i filosofi.

  127. Han pratade om
    den digitala datans hermeneutik.

  128. Han visade väldigt tydligt...

  129. ...att man med minimala data...

  130. ...som GPS-data om var man befinner
    sig vid vilken tidpunkt...

  131. ...kan dra långtgående slutsatser
    om en person.

  132. Om man vet var personen är
    vid vilken tidpunkt-

  133. -kan man räkna ut
    var personen jobbar-

  134. -och om den cyklar, åker kollektivt
    eller bil till jobbet.

  135. Man kan se om trafikregler följs
    och så vidare.

  136. Man behöver ingen info om staden-

  137. -men har man en karta kan man se
    var folk bor och var de jobbar-

  138. -om de har barn
    att köra till skolan och så vidare.

  139. Mycket kan läsas ut.

  140. Om man har personbaserad "rådata"
    och generell bakgrundsdata-

  141. -kan man få ut
    en hel del personlig data.

  142. Sen kan man lägga till
    var i staden det är-

  143. -och vilken verksamhet som bedrivs.
    Är det en gayklubb eller ett lekis?

  144. Det kan väcka
    integritetsrelaterade frågor.

  145. Sen har man social info om
    vilka man interagerar med och var...

  146. Det ger en uppfattning om vad man
    kan göra med denna lilla mängd data-

  147. -som bara visar var ens mobil
    befinner sig vid vilka tidpunkter.

  148. Tänk på exemplet.

  149. Man måste veta hur det fungerar för
    att kunna göra en etisk bedömning.

  150. Förstår man inte vad man kan göra
    med data, förstår man inte följderna.

  151. Nu tar jag staten.

  152. Ni minns kanske den här kyrkan.

  153. Rent generellt, historiskt sett-

  154. -har kyrkan och staten varit
    de som har samlat in information.

  155. Först kom kyrkböcker och sen staten.
    Så här står det på Wikipedia:

  156. "På 1700-talet betydde 'statistik'
    statens insamling av ekonomisk data."

  157. Det finns en tydlig länk mellan stat
    och statistik bara i orden.

  158. Alain Desrosières skriver
    i "The Politics of Large Numbers":

  159. "Etymologin visar att 'statistik'"-

  160. -"hör ihop med bildandet av 'staten'
    och dess administration."

  161. Behovet av att hålla koll på nationen
    gav upphov till statistikbyråer.

  162. Han jämför statistikens utveckling-

  163. -i Tyskland, Frankrike
    och Storbritannien.

  164. Statistiken har ursprungligen
    sett väldigt olika ut i dessa länder.

  165. Statens historia
    kan ses som statistikens historia.

  166. Det bör uppmärksamma en på
    kopplingen mellan kunskap och makt.

  167. Det här kommer från en mäktig aktör.

  168. Det är Vita husets rapport
    om big data från i maj.

  169. De såg att kapaciteten
    för analys av big data-

  170. -skapar en maktobalans
    mellan dem som har datan-

  171. -och dem som avsiktligt
    eller oavsiktligt levererar den.

  172. Tänk på Manovich citat om skapande,
    insamling och analys.

  173. Det är olika aktörer.

  174. Rapporten heter "Big data, Siezing
    Opportunities, Preserving Values"-

  175. -och jag ska prata lite
    om innehållet.

  176. Det börjar med diskrepansen
    rörande begreppet "big data".

  177. "Big data kan ses som egendom,
    offentlig resurs"-

  178. -"eller ett identitetsuttryck."

  179. Är det offentligt eller privat?

  180. Sen uppstår frågan om rättigheter,
    beroende på hur man definierar det.

  181. En viktig aspekt
    som jag bara ska nämna lite kort-

  182. -är skillnaden mellan offentlig data
    och ickeoffentlig data.

  183. Det här har både implicit
    och explicit berörts i rapporten.

  184. Obama-administrationen
    och andra offentliga institutioner-

  185. -vill göra statlig data offentlig.

  186. Folk förväntar sig
    att det här är på gång.

  187. Det är oftast gratis,
    trots att kostnaden för insamlingen-

  188. -är offentliga utgifter.

  189. Insamling och hantering kostar.

  190. Datan måste formateras
    och det är ett enormt jobb.

  191. Staten köper även big data
    från företag.

  192. Folk har en ensidig bild av vem som
    betalar och vem som köper.

  193. Rapporten handlar om fördelarna-

  194. -inom sjukvård, brottsbekämpning
    och nationell säkerhet-

  195. -och det tas upp explicit.

  196. Samtidigt hotar detta
    medborgerliga rättigheter.

  197. Integritet är det största ämnet-

  198. -men man tar även upp yttrandefrihet,
    jämlikhet och självstyre.

  199. Den största fördelen är prediktiv
    medicin, men det ses även som hot.

  200. Hur väl kan man förutse
    vem som blir sjuk?

  201. Hur kommer det
    att påverka ens framtida hälsa?

  202. Jag ska röra vid det lite kort och
    nämna vad man intresserar sig för.

  203. Inom utbildning handlar det om
    inlärningsbedömning-

  204. -och personanpassad utbildning.
    Här kommer integriteten in.

  205. Hur kan data om våra studier
    användas emot oss?

  206. Kan man under studietiden
    experimentera fritt?

  207. Ett stort ämne i USA är
    nationell säkerhet.

  208. Det rapporteras om databaser-

  209. -där information från olika organ
    ska samlas-

  210. -och förses med olika "tags".

  211. Dessa visar var datan kommer ifrån
    och hur den får användas-

  212. -och reglerar vem som kommer åt
    datan och hur den används.

  213. De bedyrar att det sker med hänsyn
    till den personliga integriteten.

  214. Jag väljer att tro dem
    för tillfället.

  215. Det viktiga är idén om spänningen
    mellan säkerhet och integritet.

  216. De försöker vara striktare
    inom brottsbekämpningen.

  217. Brottsbekämpningen ska ha striktare
    reglering än nationell säkerhet.

  218. Det kan avslöja traffickingnätverk
    och hitta försvunna personer-

  219. -genom utbredd övervakning.

  220. Det förhindrar även cyberbrott.

  221. En aspekt av analysen av big data
    inom brottsbekämpning-

  222. -är förebyggande av brott.
    Där blir det intressant.

  223. Om man kan upptäcka vissa mönster
    kan man förutse-

  224. -gängrelaterade mord,
    enligt ett fall i rapporten.

  225. Vet man vem som sannolikt är
    inblandad kan man agera i förväg.

  226. Det rör inte bara integritets-
    och yttrandefrihetsfrågor-

  227. -utan även frågor om självstyre
    och juridik.

  228. Det här är några av de största
    utmaningarna på det området.

  229. Det här är löftena och hoten.

  230. Jag vill ta upp två ytterligare hot.

  231. Det gäller diskriminering
    och förtroende.

  232. Jag börjar med diskriminering.

  233. Rapporten är tydlig med att man
    vill undvika diskriminering-

  234. -både avsiktlig och oavsiktlig sådan.

  235. Avsiktlig diskriminering är när man
    betalar olika pris för samma tjänst.

  236. Man såg på nyheterna
    hur Mac-användare...

  237. ...fick betala högre hotellpriser
    då de ansågs ha mer pengar.

  238. Det är ekonomisk diskriminering
    grundad på nåt man inte kan se.

  239. Man vet inte att man betalar
    ett annat pris än andra.

  240. Men så var det redan tidigare
    med försäkringar och liknande.

  241. Det är inget helt nytt
    men det är en annan nivå.

  242. Oavsiktlig diskriminering kan bero på
    programmering och design.

  243. När man utformar algoritmerna
    kan diskriminering uppkomma-

  244. -även om det inte var programmer-
    arens avsikt. Det måste man tänka på.

  245. Ett annat exempel är...

  246. ...en smartphone-app
    som heter "Bump".

  247. Den används för att skicka
    vägrapporter till myndigheterna.

  248. Det påminner mig om en presentation
    jag gjorde för tre år sen.

  249. Då presenterades en app som jag
    kritiserade av samma anledning-

  250. -och nu inser Vita Huset problemet.

  251. Fattiga och äldre
    har sämre tillgång till smartphones-

  252. -och rika områden
    kan få mer uppmärksamhet-

  253. -utifrån antalet vägrapporter
    i området.

  254. Problemet
    med det tidigare fallet var-

  255. -att läger med hemlösa
    och störande inslag kunde taggas-

  256. -vilket väcker andra frågor.
    Det är ett exempel.

  257. Vi går tillbaka till användande
    och åtkomst, som en påminnelse.

  258. Jag vill även prata om
    förtroende och öppenhet.

  259. I den här rapporten och även andra-

  260. -sägs transparens öka allmänhetens
    förtroende för regeringen.

  261. Det tycks finnas starka argument
    som talar för detta.

  262. Men transparens kan också minska
    allmänhetens förtroende.

  263. Det har visats att när forskare
    tar upp forskningens begränsningar-

  264. -kan det användas som ett argument
    mot vetenskapens validitet.

  265. Skulle insikt i förhandlingar öka
    eller minska politikerförtroendet?

  266. Man måste väga om öppenheten-

  267. -ökar eller minskar
    allmänhetens förtroende.

  268. Onora O'Neill har hävdat
    att förtroendet minskar-

  269. -p.g.a. formaliserade redovisningar
    i offentlig politik.

  270. Ju mer man visar upp,
    desto mer minskar förtroendet.

  271. Man måste skilja på förtroende
    och trovärdighet.

  272. Det som är öppet tillgängligt kan
    bedömas som mindre tillförlitligt.

  273. Att transparens skulle ge ökat
    förtroende är lite missvisande.

  274. Det borde ge en "epistemisk
    vaksamhet" där man kan faktakolla.

  275. Men öppenhet ger inte nödvändigtvis
    mer förtroende.

  276. Det är ett problematiskt argument.

  277. Jag tar ett exempel
    som jag tidigare tog upp.

  278. Tänk på förtroendet
    för dem som hanterar databaserna-

  279. -för försvaret och polisen.
    Nån måste hantera dem.

  280. Gör de det epistemiskt och etiskt
    korrekt? Kan de gå runt det?

  281. Kan man lita på dem?
    Vem ska i så fall övervaka dem?

  282. Det blir knepigt när man går in på
    vem man kan lita på.

  283. Vi ska även tänka
    på forskarvärlden...

  284. ...som en aktör som samlar in data.

  285. Det här är ofta nåt man förbiser
    vid lagstiftning.

  286. Vi pratar om offentlig data-

  287. -och vetenskap
    är ofta offentligt finansierad.

  288. Man har samlat data inom vetenskapen
    under lång tid.

  289. Galton var den som grundade den
    kvantifierade samhällsvetenskapen.

  290. Det här skulle vara Galileos teleskop
    men det syns inte.

  291. Där är en tavla av Carl Spitzweg
    där en person jagar fjärilar.

  292. Datainsamling inom biologi,
    astronomi-

  293. -samhällsvetenskap och humaniora
    har pågått länge.

  294. Men allt förändras.

  295. Det är lättare
    att hitta bilder på data-

  296. -inom biologi och astronomi än inom
    samhällsvetenskap och humaniora-

  297. -så jag valde Oxford Internet
    Institute som exempel.

  298. Frågan, nu när vi har mer data, är-

  299. -om vi står inför ett paradigmskifte
    i och med big data.

  300. Jag vill prata lite om
    vad det innebär.

  301. Ett exempel är en artikel
    av Sabina Leonelli-

  302. -om kvantitetens roll för användning
    av big data inom biologin.

  303. Hon hänvisar till Mayer-Schönbergers
    och Cukiers definition av big data-

  304. -och frågar
    om det är ett paradigmskifte.

  305. Sen beskriver hon hur big data
    används inom biologin.

  306. Biologi är ett fragmenterat
    och pluralistiskt område-

  307. -med olika metoder, material,
    bakgrundskunskap och typer av data-

  308. -om instabila organismer
    och ekosystem.

  309. Men man pushar för big data
    inom genomiken.

  310. Hon ger ett exempel på databaser
    för lagring och analys av genomdata.

  311. Målen är att integrera
    all tillgänglig data-

  312. -över organismernas biologi
    till en resurs-

  313. -med data över fysiologi,
    ämnesomsättning och morfologi.

  314. Hon förespråkar samarbete
    med andra databaser-

  315. -så att datan blir användbar
    för flera olika arter.

  316. Hon vill samla in
    information om labb-

  317. -protokoll, material och verktyg-

  318. -för att skapa en plattform
    för ett gemensamt arbete.

  319. Men det är ett enormt jobb.

  320. Det är inte som med sociala media.
    Det är svårt att använda denna data.

  321. Först måste man dekontextualisera-

  322. -datan man har fått
    i sina experiment och analyser.

  323. Målet är att formatera datan-

  324. -så att den blir kompatibel
    och lätt att analysera.

  325. Men det finns inga standarder och det
    är mycket jobb, vilket gör det dyrt.

  326. Det handlar om offentliga medel.

  327. Det finns få incitament
    för att ge bort data.

  328. Inom akademin är forskningsartiklar
    viktigare än arbetet bakom datan.

  329. Steg två är urval av metadata.

  330. Det har skett inom nationell säkerhet
    och är även nödvändigt här.

  331. Man måste se till
    att datans ursprung är synligt.

  332. Man måste ta in labbprotokoll för
    att kunna kolla info om viss data.

  333. Det görs ofta med video.

  334. Det är nödvändigt
    att ta fram standarder-

  335. -och det innebär ännu mer arbete
    än steg ett.

  336. Steg tre är återanvändning.

  337. Leonelli skriver: "Bara viss data är
    lämplig för sådan behandling."

  338. "Det finns även partiskhet i urvalet
    av vissa typer av data."

  339. Vissa områden inom biologin
    producerar mer lättformaterad data-

  340. -än andra discipliner inom biologin.

  341. Som med all klassificering
    gäller det att förformatera.

  342. Vad bestämmer man i förväg att ska
    vara kvar? Vad lämnar man öppet?

  343. Big data inom biologi
    medför ett enormt arbete.

  344. Möjligheterna och verkligheten
    går inte ihop.

  345. Det finns få incitament för databaser
    online, så där är big data litet.

  346. Det används inte
    i nån större omfattning.

  347. Jag vill återknyta
    till frågan om makt och kunskap.

  348. Man ser den digitala klyftan
    väldigt tydligt-

  349. -även inom biologin.

  350. Man ser en dominans av genetisk data
    för den är lättare att överföra.

  351. Det kan ge nya, eller stärka
    befintliga, epistemiska hierarkier-

  352. -relaterade till insamling,
    behandling och formatering av data.

  353. Det sker inom andra områden,
    som exempelvis hållbarhet-

  354. -där datormodeller
    är en central metod.

  355. Det som inte passar i en datormodell
    faller lättare bort.

  356. Hur lättanvänd datan är
    kommer att bli allt viktigare.

  357. Vad inkluderas? Vad faller bort?
    Vilka forskningsområden är relevanta?

  358. Nu ska jag prata om
    samhällsvetenskap och humaniora.

  359. Frågan är om big data
    och nya former av dataanalys-

  360. -kommer att leda till
    paradigmskiften.

  361. För databaserad samhällsvetenskap
    och humaniora-

  362. -finns en oenighet om
    hur korsningen mellan IT-

  363. -och samhällsvetenskap
    och humaniora ska se ut.

  364. Kitchin urskiljer
    två grenar i diskussionen.

  365. En är "New Empiricism", "End of
    Theory" och datadriven vetenskap-

  366. -vilket kan kopplas till
    Chris Andersons påståenden.

  367. Den andra är digital humaniora-

  368. -och beräkningsorienterad
    samhällsvetenskap. Vad innebär det?

  369. Påståendet inom "New Empiricism" är-

  370. -att data talar för sig själv.

  371. Den är fri från teorier och man
    kan använda induktiva metoder-

  372. -utan förutfattade meningar
    och hypoteser.

  373. Påståendet att korrelation
    väger tyngre än kausalitet-

  374. -är rotat i denna typ av logik.

  375. Har man nog med data behöver man
    inte oroa sig för stickprov.

  376. Då behöver man inte tänka på
    kausaliteten.

  377. Det här är mer accepterat
    inom affärs- och reklamvärlden...

  378. ...än inom vetenskapen.

  379. Den här principen blir mindre
    accepterad bland forskarna-

  380. -än bland dem som
    försöker arbeta i gränslandet.

  381. Kitchin beskriver det andra fältet-

  382. -som "en kombination av induktion,
    deduktion och abduktion".

  383. Induktion behövs för hypoteser.
    Man kan försöka närma sig data-

  384. -och sen testa hypoteser men det är
    ingen rent induktiv mekanism.

  385. Det här är redan
    satt i ett sammanhang.

  386. Man ska inte läsa av
    slumpmässig statistik ur datan.

  387. Man måste veta
    vilka frågor man vill ställa-

  388. -och vilka man inte vill ställa.

  389. Det är viktigt.

  390. Om man ska sammanfatta big data
    inom forskning och vetenskap-

  391. -kan man se en digital klyfta
    mellan och inom olika discipliner.

  392. Datavetenskap ökar i relevans
    inom många discipliner.

  393. Inom samhällsvetenskap och
    humaniora ser man-

  394. -att det kopplas till IT-frågor.

  395. Vem besvarar dessa frågor
    och får finansieringen?

  396. Sen ska man tänka på genomslaget.
    Vem utvärderar sånt?

  397. Databaserad samhällsvetenskap och
    humaniora hotas av "New Empiricism"-

  398. -men det finns även
    en intern splittring.

  399. Det finns olika traditioner inom dem.

  400. Åtkomst och användning är ett
    problem. Vem har tillgång till datan?

  401. Även inom vetenskapen har få forskare
    tillgång till företagens databanker.

  402. Man måste jobba för företaget
    för att få tillgång till dem.

  403. Och vem kan analysera datan?
    Vem har den rätta kompetensen?

  404. Nu ska jag prata om
    värdering av big data.

  405. Mycket av det jag nu säger
    har nämnts tidigare i presentationen.

  406. Man måste relatera epistemologi
    till etik och politik.

  407. Bara om man förstår vilken kunskap
    som krävs vid analys av big data-

  408. -kan man förstå de etiska
    och politiska implikationerna-

  409. -och fokusera på
    åtkomst och användning.

  410. Det finns differentiering
    som vi är vana vid-

  411. -inom filosofi och andra discipliner-

  412. -som kan bli överflödig
    i och med big data.

  413. Det görs en distinktion mellan
    personlig och icke-personlig data-

  414. -och identitetsrelaterad data
    och statistisk data.

  415. Denna distinktion har varit
    tongivande under en lång tid.

  416. Genom sammanslagning
    och behandling kan anonym data-

  417. -omvändas till personlig data.

  418. Denna identifiering blir allt enklare
    och ju mer data man har-

  419. -desto lättare är det
    att identifiera vissa personer.

  420. Jag tar ett exempel.

  421. FWF, Österrikiska vetenskapsfonden,
    bad mig fylla i en enkät-

  422. -och i slutet av den-

  423. -frågade de mig om kön,
    forskningsområde och ålder.

  424. Det gör mig identifierbar
    i Österrike.

  425. Det räcker med tre parametrar.

  426. Så man är inte särskilt anonym
    ens på den nivån.

  427. Det andra exemplet
    var en studie av Michael Zimmer-

  428. -av college-studenters Facebook-data.

  429. Samhällsvetarna har försökt visa
    att det är helt anonymt.

  430. Det är enkel data.
    Det var i nordöstra USA-

  431. -och skolan var si och så stor
    och dessa ämnen kunde läsas där.

  432. Det var tydligt
    vilka studenterna var.

  433. Med ytterligare data
    om olika studenters härkomst-

  434. -är all anonymitet borta.

  435. Det här är små exempel
    innan vi kommer till big data-

  436. -som visar
    problemen med "anonym" data.

  437. Jag tar inte upp det, för det kommer
    nog att behandlas senare.

  438. Integritet och dataskydd är de frågor
    som först kommer upp-

  439. -när folk pratar om big data.
    Det är viktigt.

  440. Men det finns andra ämnen
    som kan vara viktiga att ta upp-

  441. -som "uppmärksamhetsekonomi"
    och "uppmärksamhetsekologi".

  442. Det har diskuterats av Stefana
    Broadbent och Claire Lobet-Maris...

  443. ...som anser att våra intentioner
    måste skyddas.

  444. Jag hittade den här reklamkampanjen
    från 2011.

  445. "'Minority Report'-liknande annonser
    kan nå Storbritannien nästa år."

  446. Det handlar inte bara om
    att förutse brott-

  447. -utan även om tanken på
    avledande av uppmärksamheten.

  448. Jag har nämnt problemen
    med åtkomst och användning.

  449. Vad är fysisk åtkomst? Vad är
    tillgängligt? Vad är offentligt?

  450. Vi har problem med datamonopol,
    som exempelvis Google-

  451. -men det finns andra aktörer
    som är mindre synliga-

  452. -som kan ha ännu mer data.

  453. Vem kan använda datan?
    Hur fördelar man den kompetensen?

  454. Det slående med
    korrelation kontra kausalitet är-

  455. -att har man
    "förutseende polisarbete"-

  456. -kan distinktionen mellan kausalitet
    och korrelation försvinna.

  457. Existerar det rent intellektuellt-

  458. -eller kan man rent praktiskt
    skippa distinktionen?

  459. Om nån kan fängslas
    genom korrelation...

  460. Om det räcker med att förutse
    ett brott behövs ingen handling.

  461. Min sista punkt
    gäller åtagande och åtgärder.

  462. Det här vore skräckscenariot.

  463. Användaren
    ger gladeligen ifrån sig data-

  464. -och andra aktörer
    använder sig av datan.

  465. Men varken användaren eller forskarna
    får tillgång till datan.

  466. Det vill man undvika.

  467. Hur kan det göras? Hur kan man
    stärka den allmänna egendomen?

  468. Jag ger vissa förslag på hur det kan
    göras för att få igång debatten.

  469. Det är lättast att tänka på
    vad forskarna kan göra-

  470. -för det är det område
    jag är insatt i.

  471. Jag tror vi behöver forska kritiskt
    på hur big data används.

  472. Journalen "Big Data and Society"
    lanserades i sommar-

  473. -för dem som
    är intresserade av big data.

  474. De vill diskutera big data
    tvärvetenskapligt-

  475. -och diskutera metoder, epistemologi
    och ontologi.

  476. Det är även viktigt med datapolitik,
    dataekonomi och dataekologi.

  477. Det ger en bild av bredden
    på de frågor vi ställer.

  478. En annan strategi
    - jag jobbar med datavetare - är...

  479. ...aktivt deltagande
    i forskningsprojekt på big data.

  480. Vi behöver-

  481. -balans och tvärvetenskapliga
    forskningsgrupper för att undvika-

  482. -att man närmar sig samhällsvetenskap
    och humaniora för simplistiskt.

  483. Jag ser det ofta-

  484. -i viss beräkningsorienterad
    samhällsvetenskap.

  485. Jag håller datavetenskap
    väldigt högt-

  486. -men det ses som
    ett oviktigt samarbete-

  487. -där man tror att "alla kan prata om
    samhället, eller hur?"

  488. Min sista punkt handlar om
    finansiering av forskning.

  489. Ett av resultaten från
    Onlife Initiative har varit-

  490. -att vi bad om forskningsanslag
    för våra idéer-

  491. -som blev en utvärdering av
    ett program för Österrikes regering.

  492. Vi försöker se till att
    forskare kan påverka finansieringen.

  493. Det kan vara minimalt
    men kan vara värdefullt.

  494. Det blir svårare när man kommer in på
    vad statliga aktörer kan göra.

  495. Man kan prata om politik,
    administration, juridik och polis-

  496. -och de skiljer sig mycket åt.

  497. Huvudfrågan är hur trovärdigheten
    hos statliga aktörer kan stärkas.

  498. Kan vi lita på juridiskt skydd
    genom statlig övervakning?

  499. Behöver vi inte snarare verktyg
    för kryptering?

  500. Men tänk på att krypteringsverktyg
    ibland ses som ammunition.

  501. Att använda dessa verktyg
    kan i sig vara en kriminell handling.

  502. Nu är jag ute på tunn is
    för det är inte mitt expertområde.

  503. Här är några tankar
    om vad man kan göra.

  504. Vad har privata aktörer för intresse
    av den allmänna egendomen?

  505. Grunden för de problem vi ser
    med big data är-

  506. -det som i Vita Husets rapport
    kallades "reklambaserat ekosystem".

  507. Morozov kallade det
    "informationskonsumtion".

  508. Det är tanken om
    att inte betala för vissa tjänster.

  509. Vissa saker förväntas vara gratis
    och man ger bort data gratis.

  510. Vi behöver nya affärsmodeller som
    bygger på värdet av data och varor.

  511. Om gratis är normalfallet,
    hur ska då företagen få in pengar?

  512. Det är en viktig fråga i sig.

  513. Vi kan tänka oss att datajournalism
    kan funka som en ny medlare.

  514. Vilken kompetens behövs där?
    Sen har vi naturligtvis utbildning.

  515. Jag avslutar med den här frågan.
    Jag har inget svar på den-

  516. -men det är den första presentationen
    så jag lämnar den öppen.

  517. Man bör börja med att engagera sig
    i processen på nåt sätt.

  518. Tack.

  519. Översättning: Henrik Johansson
    www.btistudios.com

Hjälp

Stäng

Skapa klipp

Klippets starttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.

Klippets sluttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.Sluttiden behöver vara efter starttiden.

Bädda in ditt klipp:

Bädda in programmet

Du som arbetar som lärare får bädda in program från UR om programmet ska användas för utbildning. Godkänn användarvillkoren för att fortsätta din inbäddning.

tillbaka

Bädda in programmet

tillbaka

Så används big data

Produktionsår:
Längd:
Tillgängligt till:

Judith Simon är forskare vid IT-universitetet i Köpenhamn. Hon föreläser här om hur stora dataflöden, så kallad big data, används i skolsystem, i forskning och i syfte att övervaka. Hur vet vi att big data används i goda syften och inte emot en nations medborgare? Hur påverkar det grundläggande demokratiska rättigheter, så som yttrandefrihet och personlig integritet? Inspelat i september 2014. Arrangör: Uppsala universitet.

Ämnen:
Information och media > Internet och digitala medier, Samhällskunskap
Ämnesord:
Big data, IT, Informationssamhället, Informationsteknik, Personlig integritet
Utbildningsnivå:
Högskola

Alla program i UR Samtiden - Demokrati i en digital era

Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Så används big data

Judith Simon är forskare vid IT-universitetet i Köpenhamn. Hon föreläser här om hur stora dataflöden, så kallad big data, används i skolsystem, i forskning och i syfte att övervaka. Hur vet vi att big data används i goda syften? Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Demokratifrågor på nätet

Peter Dahlgren är professor emeritus på Uppsala universitet och föreläser om hur de sociala nätverken påverkar hur vi kommunicerar och tänker. Han resonerar kring hur internet förändrar oss som människor. Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Att skydda det privata

Bert-Jaap Koops är professor vid Tilburguniversitetet i Nederländerna och föreläser om hur den privata sfären är i upplösning. Hur ser gränserna ut för det privata i den nära framtiden och vilka lagar ska skydda oss när nästan hela vårt privatliv ryms i mobiltelefonen? Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Risker med big data

Data- och informationsforskaren Mireille Hildebrandt föreläser om företags och organisationers användning av big data. Är vi slavar under de datamängder som sparas om oss? Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Rättighetsfrågor på nätet

Sebastian Haunss från universitetet i Bremen föreläser om juridiska utmaningar på nätet när information som film och foton flödar fritt. Han berättar om politiseringen av information i kunskapssamhället och om vilka utmaningarna är att hantera detta i framtiden. Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Staten och datakapitalet

Luciano Floridi är forskare vid universitetet i Oxford och föreläser om faran med att stora insamlade datamängder om användares beteenden på nätet hamnar i kapitalets händer. Han menar att de stora datamängderna, big data, borde vara till allmänhetens nytta. Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - Demokrati i en digital era

Etik i det digitala samhället

Statsvetaren Ben Wagner föreläser om att länders regeringar har allt mindre att säga till om när det gäller etik och yttrandefrihet i det globala, digitala samhället. Det är istället de olika sociala mediernas regelverk som styr. Inspelat i september 2014. Arrangör: Uppsala universitet.

Produktionsår:
2015
Utbildningsnivå:
Högskola
Beskrivning
Visa fler

Mer högskola & information och media

Spelbarhet:
UR Skola
Längd
Titta UR Samtiden - Kvinnor, krig och flykt

Kvinnan mitt i kriget

Journalisten Terese Cristiansson har skrivit om mamman som vill sälja sin dotter, intervjuat IS-domare och talibankvinnor. I Turkiet, Afghanistan och Pakistan har hon alltid fokuserat på dem som har svagast röst i samhället. Och det är oftast kvinnorna. Här berättar hon om sitt arbete. Inspelat på Lunds universitet den 8 mars 2016. Arrangör: Lunds universitet.

Spelbarhet:
UR Skola
Längd
Lyssna Bildningsbyrån - historia

Lars Johan och Wendela, två tidningspionjärer

Lars Johan Hierta startade Aftonbladet år 1830 och startade därmed en ny epok i svensk presshistoria. 1841 anställde han Wendela Hebbe, den första kvinnliga skribenten med fast anställning