Titta

UR Samtiden - ResearchED 2018

UR Samtiden - ResearchED 2018

Om UR Samtiden - ResearchED 2018

Föreläsningar från den internationella skolkonferensen ResearchED. Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Till första programmet

UR Samtiden - ResearchED 2018 : Tillförlitlig bedömning av valfria ämnenDela
  1. När barnen har gjort sina uppgifter,
    vilka de nu är-

  2. -börjar ert jobb
    med att göra bedömningarna.

  3. Jag heter Daisy Christodoulou-

  4. -och jobbar för brittiska
    No More Marking.

  5. Vi inför komparativ bedömning-

  6. -på skolor som vill förbättra
    bedömningen av elevprestationer.

  7. I dag ska jag berätta om hur man kan
    använda komparativ bedömning-

  8. -för att mäta framsteg vid skrivande.

  9. Jag är alltså utbildningsansvarig
    för No More Marking.

  10. Innan det var jag engelsklärare-

  11. -så jag har mycket erfarenhet av
    att bedöma uppsatser.

  12. Jag blev frustrerad
    både av hur mycket tid det tog-

  13. -och av att bedömningarna man gjorde
    inte alltid-

  14. -tycktes bedöma rätt saker.

  15. Vissa kriterier som vi använde
    hjälpte inte eleverna att bli bättre.

  16. I dag ska jag prata om-

  17. -hur vi i dag mäter framsteg
    inom skrivande-

  18. -och om det finns sätt
    att hantera de brister som råder.

  19. Det var en överblick.
    Vi börjar från början.

  20. Bedömning av slutna frågor,
    som de två exempel jag visar här-

  21. -är väldigt enkelt.
    Jag har två enkla uppgifter här.

  22. Två plus två är lika med vad?
    Vad är 20 % av 300?

  23. Om en elev skrev ett svar vore det
    ganska lätt att bedöma om det var rätt.

  24. Det är slutna frågor.
    De är ganska lätta att bedöma.

  25. Som jämförelse är det svårare
    att bedöma öppna frågor.

  26. Som engelsklärare ville jag ofta
    bedöma öppna frågor.

  27. Slutna frågor har ett värde
    och är viktiga-

  28. -men som engelsklärare vill man ofta
    bedöma såna här frågor.

  29. Mitt exempel är:
    "Skriv om en dag på stranden."

  30. Det här gäller förstås alla uppsatser
    eller längre skrifter.

  31. Det är inte lika lätt att bedöma
    som de förra uppgifterna.

  32. För såna här uppgifter gör bedömare
    snarlika bedömningar.

  33. De flesta är överens om rätt svar.

  34. Med såna här uppgifter
    brukar bedömare ha olika åsikter-

  35. -även om de har
    samma bedömningskriterier.

  36. De har kanske olika åsikter om
    vad kvalitet är.

  37. Att bedöma öppna frågor är svårt.

  38. För att titta lite mer på skillnaden
    tänkte jag använda en sportanalogi.

  39. Det vi gör i våra bedömningar-

  40. -bygger på en kvalitetsmodell
    och en svårighetsmodell.

  41. Jag har lånat analogin
    och terminologin-

  42. -från en artikel av
    Alastair Pollitt och Ayesha Ahmed.

  43. Referensen kommer på nästa bild.

  44. Ahmed och Pollitt skriver om...

  45. Dels har vi slutna frågor,
    som är lite som höjdhopp.

  46. Det är svårighetsmodellen.

  47. Sen har vi isdans,
    som är mer som öppna frågor.

  48. De kallar det kvalitetsmodellen.
    Vi kan titta närmare på modellerna.

  49. Kvalitetsmodellen visas här.
    Längst ner står artikeln jag citerar.

  50. Kvalitetsmodellen är lite som
    de öppna frågorna jag nämnde.

  51. Man "ber eleverna att göra nånting
    och ser hur de presterar".

  52. Det här är citat från artikeln.

  53. När man har bett dem göra det
    har man nån sorts kriterier-

  54. -och använder dem för att bedöma
    elevernas prestationer.

  55. Som det står här.

  56. Analogin är, som ni kanske anar,
    till isdans.

  57. Isdans bedöms på det här sättet.

  58. "Tävlingar inom isdans bedöms
    utifrån en kvalitetsmodell."

  59. "Konståkaren uppträder på ett sätt
    som ska imponera på domarna."

  60. Det är en bedömningsmodell.

  61. En annan bedömningsmodell,
    svårighetsmodellen-

  62. -påminner mer om höjdhopp.

  63. Där ger man elever en serie uppgifter-

  64. -som ofta ökar i svårighetsgrad.

  65. Man börjar med enkla uppgifter
    och ökar sen svårighetsgraden.

  66. Det man vill se är vilka uppgifter
    som eleverna klarar.

  67. Man når en punkt
    när de inte klarar fler. Så ser det ut.

  68. Det var alltså svårighetsmodellen.

  69. Man försöker, utifrån elevernas svar,
    bedöma hur bra de har klarat sig.

  70. Höjdhoppstävlingar är bra exempel
    på svårighetsmodellen:

  71. En serie uppgifter
    med tilltagande svårighetsgrad.

  72. Det är två vanliga bedömningsmetoder
    inom utbildning.

  73. De ger nog
    lika stora tekniska utmaningar-

  74. -men utmaningarna skiljer sig åt.

  75. Utmaningarna är lika stora,
    men ter sig olika.

  76. I kvalitetsmodellen är
    den stora utmaningen-

  77. -för bedömaren att bedöma
    de prestationer som har gjorts.

  78. I svårighetsmodellen
    finns tekniska utmaningar, men de rör-

  79. -att se till att frågorna är enhetliga
    och har rätt svårighetsgrad.

  80. I kvalitetsmodellen gäller frågan
    bedömarnas tillförlighet.

  81. Hur får vi bedömarna att vara överens
    om isdansen-

  82. -eller uppsatsen eller vad det nu är.

  83. I svårighetsmodellen
    handlar det om frågeurvalet.

  84. Om vi ska överföra det på
    hur det ser ut för en bedömare...

  85. I kvalitetsmodellen blir det mycket jobb
    efter mätningen.

  86. När barnen har gjort sina uppgifter,
    vilka de nu är-

  87. -börjar ert jobb
    med att göra bedömningarna.

  88. I svårighetsmodellen
    ligger arbetet tidigare.

  89. Arbetet består i frågeurvalet.

  90. Därmed kan bedömningen bli
    ganska enkel.

  91. Utmaningen är alltså denna:

  92. Bedömning av kvalitetsuppgifter,
    som uppsatser, är sällan tillförlitlig.

  93. Det är svårt att få olika bedömare-

  94. -att komma överens om
    bedömningen av en viss uppsats.

  95. Det finns mycket data
    som bekräftar det.

  96. En färsk studie från Ofqual,
    den engelska tillsynsmyndigheten-

  97. -visade att i en typisk 40-poängsfråga-

  98. -i slutprovet som eleverna gör
    vid 16 års ålder-

  99. -kan en genomsnittlig uppsats
    som kan ge 40 poäng-

  100. -ha en felmarginal om plus/minus fem
    när det gäller bedömningen.

  101. Plus/minus fem poäng av 40
    är ganska mycket.

  102. De ansvariga investerar
    mycket tid och resurser-

  103. -i att göra bedömningarna
    så tillförlitliga det går.

  104. De ger således en förebild för
    hur man kan bedöma såna uppgifter-

  105. -men även där
    är felmarginalen alltså stor.

  106. Tillförligheten är väldigt viktig,
    vilket jag nog inte insåg som lärare.

  107. Den är viktig, särskilt när man vill se
    ett barns utveckling över tid.

  108. Om man har en stor felmarginal
    vid varje bedömning-

  109. -hur vet man om en ökning
    om 3-4 poäng är en förbättring?

  110. Tillförlitlighet är alltså viktigt.
    Det är inte bara nåt pedantiskt.

  111. Det är viktigt om vi ska förstå
    om våra barn gör framsteg.

  112. Sen finns en mer filosofisk aspekt:

  113. Om vi inte kan komma överens om
    vad kvalitativt skrivande är-

  114. -kanske vi inte vet vad det är.

  115. Hur kan vi då lära ut det,
    om vi inte vet hur det ser ut?

  116. Därför måste vi komma överens om-

  117. -hur en bra uppsats ser ut,
    även om det är svårt.

  118. Hur har det här tillförlighetsproblemet
    tidigare hanterats?

  119. Hur brukar bedömningsorganisationer,
    lagstiftare, lärare...

  120. Hur löser de problemet?

  121. En sak folk brukar göra är
    att skapa bedömningskriterier-

  122. -som är väldigt specifika.

  123. Det baseras på att folk
    reagerar på uppsatser på olika sätt.

  124. Ett sätt att få folk
    att få större samsyn-

  125. -är att skapa en checklista
    med specifika kriterier.

  126. En elev som gör dessa saker
    får betyg A.

  127. En elev som gör dessa saker
    får bara betyg B.

  128. Det kan framstå som en bra lösning.

  129. Man är mer precis
    och specificerar vad man vill se.

  130. Det kan också framstå som
    att gagna eleverna-

  131. -eftersom det ger större precision.

  132. De får större transparens i
    vad som förväntas av dem.

  133. De vet att om de gör vissa saker
    får de ett visst betyg.

  134. Just den här lösningen på problemet-

  135. -användes i det engelska systemet
    för några år sen.

  136. Där gör elever vid 11 års ålder-

  137. -läsförståelseprov och matematikprov
    som följer svårighetsmodellen.

  138. De gör också ett uppsatsprov
    som har haft tillförlighetsproblem.

  139. Först rättades de,
    med låg tillförlitlighet.

  140. Sen användes lärarbedömningar,
    men det ökade inte tillförlitligheten.

  141. Det fanns fortfarande skillnader.

  142. En sak som regeringen föreslog
    för att motverka låg tillförlitlighet-

  143. -var så kallade
    "skräddarsydda bedömningskriterier".

  144. Tanken var
    mer precisa bedömningskriterier.

  145. Eleverna skulle göra vissa saker
    i uppsatserna-

  146. -för att få ett visst betyg.
    Det skulle ge större enhetlighet-

  147. -och minska skillnaderna
    mellan olika områden.

  148. Ytligt sett borde ökad vägledning,
    ökad precision och ökad transparens-

  149. -ge högre tillförlitlighet.

  150. Ni kanske anar ett "men".
    Det kommer ett sådant.

  151. Problemet med ansatsen var
    att det ledde till stereotypt skrivande-

  152. -och förvrängde också
    det som är kärnan i välskrivna texter.

  153. Jag kan sammanfatta poängen:

  154. Folk har försökt hantera
    tillförlitlighetsproblemet-

  155. -genom att skapa
    specifika bedömningskriterier.

  156. Problemet är att det ger
    stereotypa svar från elever.

  157. Och det ökade inte tillförlitligheten
    särskilt mycket heller.

  158. Det skapade alltså bara nya problem.

  159. Jag vill prata om
    de oavsiktliga konsekvenserna-

  160. -av såna här
    specifika bedömningskriterier.

  161. Vi kan titta här...

  162. Till vänster har vi exempel
    på specifika regler.

  163. Först: "Använder välskrivna texter
    adverbialinledda meningar?"

  164. Exempel på adverbialinledning är:
    "Plötsligt sprang jag till dörren."

  165. "Hastigt såg jag mig om."

  166. Folk har sett att välskrivna texter ofta
    har adverbial i början av meningar.

  167. Det verkar logiskt att säga
    att det kan förbättra ens skrivande.

  168. I praktiken blir det som i exemplet.
    Elever skriver saker som:

  169. "Förglömligt smög han till dörren."

  170. Det är adverbialinlett,
    så man kan bocka av det på listan-

  171. -men är det begripligt?

  172. Nästa regel: en välskriven text
    är väl mestadels rättstavad?

  173. Det kan vi väl vara överens om?

  174. Den oavsiktliga konsekvensen är
    att eleverna känner till-

  175. -det här kravet. Vad gör de?

  176. Man hoppas att det ska
    uppmuntra elever att stava rätt-

  177. -men i praktiken gör det
    att eleverna använder enklare ord-

  178. -eller ord som är lätta att stava.
    De blir mindre ambitiösa.

  179. Sist har vi min favorit.
    Det är en parodi.

  180. Det fanns ett lite udda krav:
    "Elever ska kunna byta stilnivå."

  181. En välskriven text anpassar sig
    utifrån läsaren.

  182. En formell målgrupp får en formell text.
    En bra skribent kan byta stilnivå.

  183. Det är sant,
    men vad ger det för resultat?

  184. Det är en parodi:

  185. "Berättelsen slutade tvärt,
    med ett byte av stilnivå, asså."

  186. "Asså" är ett slangord.

  187. Elever kan börja tvinga in slangord-

  188. -för att visa att de kan byta stilnivå.

  189. Det är tre exempel.
    Det finns många fler.

  190. Den sista är en parodi.
    Många lärare har parodierat det här.

  191. Det är lätt att parodiera.

  192. Det här är oavsiktliga konsekvenser.
    Grunden är en djupare filosofisk fråga.

  193. Jag tror att den som beskrev den bäst
    var filosofen Michael Polanyi.

  194. Polanyi skrev mycket
    om konceptet "tyst kunskap".

  195. Det finns objektiva kunskapsmassor-

  196. -alltså verkliga saker
    som folk är överens om-

  197. -som är svåra att uttrycka i klartext.
    De är svåra att nedteckna.

  198. Polanyi sa att vi ofta vet mer
    än vi kan förklara.

  199. Jag tycker konceptet är utmanande
    eftersom vi är vana...

  200. Vi lever i en skriftbaserad kultur.

  201. Att nånting är nedtecknat
    ger det auktoritet.

  202. Folk vill gärna ha saker nedtecknade.

  203. Polanyi säger att vissa företeelser...

  204. De är inte subjektiva saker
    som individer har olika åsikter om-

  205. -utan alla är överens,
    men de är svåra att uttrycka i klartext.

  206. När man uttrycker dem i klartext
    säger Polanyi att-

  207. -det slutar i absurditeter.

  208. När jag läste det tänkte jag på det här.
    "Förglömligt smög han till dörren."

  209. När man ska identifiera
    en välskriven text-

  210. -slutar det ofta i absurditeter.

  211. Det är en oavsiktlig konsekvens
    av specifika bedömningskriterier.

  212. Det här har hänt i verkligheten.

  213. Jag har själv upplevt det.
    Det hände inom loppet av 2-3 år.

  214. Vi fick se det ske.

  215. Jag har målat upp några problem
    och vill ge er några lösningar.

  216. Därför ska jag ge lösningar-

  217. -men för att illustrera problemet
    har jag några exempel ur verkligheten.

  218. Här är ett utdrag ur en större samling
    av barns texter.

  219. Den här texten skrevs av en elvaåring.

  220. Det är i slutet av
    det första utbildningssteget i England.

  221. Ni kan väl läsa igenom texten.

  222. Mars är fjärde planeten från solen
    och granne med jorden!

  223. Jag ska visa den igen,
    men först en text från en annan elev.

  224. Här har vi den. Texten skrevs
    under samma förhållanden.

  225. Eleven är lika gammal
    och i samma årskurs.

  226. En solig kväll stod ett gäng
    på fotbollsplanen.

  227. Jag kallar helt enkelt texterna
    "Fotboll" och "Mars".

  228. Det är våra två texter.

  229. Jag vill att ni läser dem
    och tänker igenom-

  230. -vilken ni tycker är mer välskriven.

  231. Jag ber er inte tänka
    utifrån nåt visst kriterium-

  232. -eller en samling deskriptorer.

  233. Jag vill att ni funderar över
    vilken text ni tycker är mer välskriven.

  234. Jag ska inte be er rösta,
    utan bara tänka efter vad ni tycker.

  235. Vi har gjort övningen mer formellt,
    som ett led i vår forskningen-

  236. -och informellt i såna här grupper,
    med handuppräckning.

  237. "Vilken text är mer välskriven?"

  238. Det vi har sett, i både
    informella och formella sammanhang-

  239. -är att folk tycker
    att "Mars" är mer välskriven.

  240. Kanske inte enhälligt,
    men ganska konsekvent.

  241. Folk tycker
    att "Fotboll" är mindre välskriven-

  242. -alltså texten till vänster.

  243. Det tycks vara lärares bedömning
    när de får se de här texterna.

  244. Det vi såg när texterna bedömdes
    utifrån bedömningskriterierna-

  245. -alltså de tydliga deskriptorerna-

  246. -var att bedömningen då blev
    den rakt motsatta.

  247. När texterna bedömdes med kriterier
    sa folk tvärtom.

  248. De sa att de måste säga
    att "Fotboll" var mer välskriven.

  249. I den formella bedömningen av provet
    var det alltså det som hände.

  250. "Fotboll" fick ett högre betyg.

  251. Det är ett fall som är väldigt tydligt.

  252. Om man tittar på data
    är det verkligen väldigt tydligt-

  253. -att det var en stor skillnad
    mellan lärares bedömning av texterna-

  254. -om de utgick från helhetsintrycket-

  255. -och lärarnas bedömning
    utifrån bedömningskriterierna.

  256. Skälet att "Mars" fick sämre betyg
    när kriterierna användes-

  257. -är på grund av stavningsdeskriptorn
    som jag pratade om.

  258. I "Mars" finns ett antal felstavade ord.

  259. I "Mars" finns felstavningar av
    "egyptisk", "magnifik"-

  260. -och ett par andra ord.

  261. Men min fråga är
    om "Fotboll" kan stava de orden.

  262. "Egyptisk" och "magnifik"
    är svåra att stava.

  263. Vi vet inte om "Fotboll" kan stava dem.

  264. Det belyser problemet
    jag nämnde tidigare.

  265. Det som händer är
    att elever som "Mars" tänker:

  266. "Bäst att inte använda ambitiösa ord
    som jag kanske stavar fel..."

  267. "...för då blir jag bestraffad."

  268. Vi uppmuntrar alltså
    en ganska trist, enkel stil.

  269. Jag hoppas att ni ser i "Fotboll"-

  270. -att läraren har märkt upp saker
    som finns i kriterierna.

  271. De lila markeringarna är lärarens.
    "Ja, eleven har gjort detta."

  272. När man har specifika kriterier-

  273. -främjar man det här sättet
    att undervisa och lära sig-

  274. -i stället för en mer holistisk ansats.

  275. Jag tycker det är problematiskt,
    för då är våra bedömningsverktyg-

  276. -inte neutrala, utan har en inverkan
    på undervisning och inlärning.

  277. Jag menar att inverkan är negativ.

  278. De här texterna är från för två år sen,
    när bedömningsmetoden var ny.

  279. Ju längre den finns kvar,
    desto mer kommer vi att se-

  280. -att sånt här skrivande uppmuntras
    och det andra avskräcks ifrån.

  281. Det är problematiskt.

  282. Jag hoppas att det illustrerar
    vad problemet är-

  283. -med användning av specifika kriterier.

  284. Åter till frågorna jag började med:

  285. "Hur bedömer vi elevers framsteg
    i skrivande?"

  286. "Hur påverkar det undervisning?"

  287. Jag hoppas att ni ser
    att specifika kriterier inte hjälper.

  288. Det är inte bara att de inte har
    förbättrat tillförlitligheten-

  289. -utan de förvränger även
    det vi vill mäta. Vi uppmuntrar fel sak.

  290. Vad är det vi behöver?

  291. Jo, vi behöver en holistisk metod
    som baseras på kvalitetsbedömning.

  292. Men metoden måste vara konsekvent
    och immun mot inflation.

  293. Vi behöver alltså två viktiga saker
    som är svåra att få till-

  294. -och som ofta motverkar varann.

  295. Vi vill ha nåt som främjar
    den där tysta kunskapen.

  296. "Ja, det här är hög kvalitet,
    även om jag inte kan förklara varför."

  297. Samtidigt ska metoden vara enhetlig
    och tillämpas på samma sätt-

  298. -för om den är rent subjektiv är frågan
    om eleverna lär sig rätt saker.

  299. Hur kan vi uppnå nåt sånt?
    Utan en sån metod får vi problem.

  300. Utan en sån metod
    kommer undervisningen att styras-

  301. -av en samling deskriptorer
    som inte fångar upp kvalitet-

  302. -och ger stereotypa, förvrängda svar.

  303. Vi behöver en metod som möjliggör
    holistisk kvalitetsbedömning-

  304. -men som är konsekvent
    och tillförlitlig. Vad ska vi göra?

  305. Här skulle jag säga
    att komparativ bedömning kommer in.

  306. Komparativ bedömning är
    en annan bedömningsmetod.

  307. Den kan tillämpas på uppgifter
    som bygger på kvalitetsmodellen.

  308. Den traditionella metoden,
    den som vi är vana vid-

  309. -och som vi brukar använda,
    funkar så här.

  310. Vi har en text av nåt slag
    och en samling deskriptorer.

  311. Jag har ett gammalt exempel
    från England:

  312. "Jag kan göra en inledning.
    Jag kan ge detaljer om händelser."

  313. Normalt sett görs bedömningen
    genom att frågar vi oss själva:

  314. "Uppfyller uppsatsen kriterierna?"

  315. Vi har en uppsats och frågar:
    "Vilken standard håller den?"

  316. Vi kanske har olika kriterier
    för olika nivåer.

  317. Men som jag hoppas att jag har visat
    har den modellen problem.

  318. Den är inte tillförlitlig.
    Specificitet ska öka tillförlitligheten-

  319. -men det ger stereotypa svar.

  320. Man förlorar poängen
    med att ha en öppen uppgift.

  321. Komparativ bedömning är nåt annat.
    Så här funkar det:

  322. I stället för en uppsats och kriterier
    har man två uppsatser.

  323. De visas på skärmen, ett par i taget.

  324. Frågan är: "Vilken är mer välskriven?
    Vilken föredrar jag?"

  325. Då kan man göra
    en holistisk bedömning, utan kriterier.

  326. Man behöver inte rättfärdiga det
    utifrån bedömningskriterierna.

  327. Tycker man att texten är bättre
    säger man det.

  328. Och om man gör en serie såna beslut-

  329. -och ens kollegor också gör
    en serie såna beslut-

  330. -kombinerar den komparativa
    algoritmen alla beslut-

  331. -och gör en bedömningsskala.
    Så funkar komparativ bedömning.

  332. Här är ett exempel på
    hur det ser ut i verkligheten.

  333. Här är två texter bredvid varann.

  334. Det är två texter
    skrivna av åttaåringar, tror jag.

  335. Föredrar du texten till vänster
    klickar du på den.

  336. Föredrar du texten till höger
    klickar du på den.

  337. Första gången man gör det-

  338. -vilket för mig var för två år sen,
    så känns det konstigt.

  339. Om man är van vid betygskriterier
    känns det fel-

  340. -för man går på magkänsla.

  341. Man säger: "Jag gillar den.
    Den känns bra."

  342. Man går igenom en serie bedömningar
    och det går ganska fort.

  343. Det beror på texternas längd,
    bedömaren och beslutet-

  344. -men det tar oftast 20-30 sekunder.

  345. De kan gå igenom dem ganska fort.

  346. Det fascinerande är
    att fast bedömningarna görs enskilt-

  347. -alltså att folk gör dem
    oberoende av varann-

  348. -så ser vi ofta,
    när vi sammanställer besluten-

  349. -en väldigt hög samstämmighet.

  350. Vi har gjort flera studier
    där resultaten förbluffar mig.

  351. Jag var van vid traditionell bedömning-

  352. -där man sitter i ett rum
    med sina texter-

  353. -och grälar om vilken som är bäst.
    Det är så man brukar göra.

  354. Då får man inte se så många texter
    och ofta är man väldigt oense.

  355. Folk säger: "Nej, jag håller inte med."

  356. Men när man gör så här får man
    en förbluffande samstämmighet.

  357. Skälet till det är-

  358. -att komparativ bedömning bygger på
    hur hjärnan fungerar.

  359. Hjärnan är inte så bra på
    absoluta bedömningar-

  360. -alltså att titta på nånting
    och bedöma det.

  361. Hjärnan är bättre på jämförelser
    och det gäller inte bara uppsatser.

  362. Om nån kommer in hit
    och jag frågar hur lång personen är-

  363. -skulle ni kunna gissa,
    men skulle nog inte vara överens.

  364. Om de är två
    och jag frågar vem som är längre-

  365. -skulle de flesta av er vara överens
    om vem det är.

  366. Det som komparativ bedömning gör
    som skapar samstämmighet-

  367. -är att använda hur hjärnan fungerar.

  368. Traditionell betygssättning
    går tvärtemot hur hjärnan fungerar.

  369. Att så många engelsklärare
    avskyr betygssättning-

  370. -och undviker det hela helgen-

  371. -ända fram till söndag kväll,
    när alla andra sitter framför teven.

  372. Skälet är att betygssättning inte
    bygger på hur hjärnan fungerar.

  373. Det fascinerande är
    att folk gillar att göra det här.

  374. Det är kul. Eva Hartell presenterade
    komparativ bedömning tidigare-

  375. -och hon såg samma sak i Sverige.

  376. Det är kul,
    även om det känns konstigt i början.

  377. En av våra lärare kallade det
    en "uttråkningsbotare".

  378. Han föredrar att göra så här.
    Det är också snabbare.

  379. Och det främsta, långsiktiga värdet-

  380. -är det vi har pratat om hela tiden,
    alltså validitet.

  381. Man får bedöma det man vill bedöma,
    mer holistiskt.

  382. Så det är tre fördelar.
    Validitet är viktigt-

  383. -men man får också
    mer tillförlitlighet och effektivitet.

  384. Och jag förbluffas
    över graden av samstämmighet.

  385. Nåt som fascinerar mig är
    graden av samstämmighet-

  386. -bland lärare som lärt sig
    väldigt olika kriterier.

  387. I det engelska systemet infördes
    nya kriterier för två år sen-

  388. -men bara för lägre årskurser.
    Lärare av yngre barn kände till dem.

  389. De som undervisade äldre barn
    var inte bekanta med de kriterierna.

  390. Vi bad högstadielärare att bedöma
    lågstadieelevers uppgifter-

  391. -och även lågstadielärare.

  392. Det var alltså två grupper
    som lärt sig helt olika kriterier.

  393. Samstämmigheten var ändå hög
    av vilka texter som var mer välskrivna.

  394. Sen fick de bedöma äldre elever.
    Återigen var samstämmigheten hög.

  395. Det antyder, för att anknyta till
    Michael Polanyi igen-

  396. -att det finns tyst kunskap
    kring välskrivna texter-

  397. -som många engelsklärare bär på.
    Vi kan mäta deras samstämmighet.

  398. Men den förståelsen
    och tysta kunskapen om skrivande-

  399. -är oberoende av betygskriterierna.

  400. Hur skulle vi få samstämmighet mellan
    lärare som lärt sig olika kriterier-

  401. -om det berodde på kriterierna?

  402. Vi trodde att det fanns nåt
    som var oberoende av kriterierna.

  403. Vi gjorde småskaliga studier
    för att testa intressanta saker.

  404. Vi bad skribenter som inte var lärare
    att göra bedömningar.

  405. Vi bad journalister att bedöma
    lågstadieelevers texter.

  406. De var också överens med lärarna.
    Inte allihop-

  407. -men folk som lever på att läsa, skriva
    och att tänka på skrivande-

  408. -tycks kunna bedöma kvalitet
    med hög enhetlighet.

  409. Det säger oss nånting intressant
    om vad kvalitet är.

  410. Man kan låta elever
    gör komparativ bedömning av varann-

  411. -alltså att barnen får bedöma
    sina egna texter.

  412. I sixth form har vi lärare som låter
    eleverna bedöma uppsatserna-

  413. -som de själva har skrivit.

  414. Om vi går tillbaka till mitt dilemma...
    Vi vill använda öppna uppgifter-

  415. -särskilt i ämnen där man är
    intresserad av uppsatsuppgifter.

  416. Vi vill ha öppna uppgifter
    eftersom de utmanar eleverna-

  417. -och ger oss insikt i hur de presterar.

  418. Problemet med det är tillförlitlighet.

  419. Vi har sett att om vi ökar precisionen
    i betygskriterierna-

  420. -ökar det inte tillförlitligheten,
    men skapar problem med validiteten.

  421. Det förvränger också inlärning.

  422. Ett sätt att lösa problemet
    är med komparativ bedömning-

  423. -som möjliggör holistiska bedömningar
    med hög tillförlitlighet.

  424. Därför tror jag komparativ bedömning
    kan hjälpa oss att lösa problemet-

  425. -som drabbar uppsatsbedömning.

  426. Översättning: Linnéa Holmén
    www.btistudios.com

Hjälp

Stäng

Skapa klipp

Klippets starttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.

Klippets sluttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.Sluttiden behöver vara efter starttiden.

Bädda in ditt klipp:

Bädda in programmet

Du som arbetar som lärare får bädda in program från UR om programmet ska användas för utbildning. Godkänn användarvillkoren för att fortsätta din inbäddning.

tillbaka

Bädda in programmet

tillbaka

Tillförlitlig bedömning av valfria ämnen

Produktionsår:
Längd:
Tillgängligt till:

Valfria ämnen, som essäer, är mer autentiska men svårare att bedöma på ett tillförlitligt sätt. Daisy Christodoulou är utbildningsdirektör vid No more marking. Hon arbetar nära skolor med att utveckla nya metoder för bedömning. Här hör du hur hon anser man kan möta denna utmaning. Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Ämnen:
Pedagogiska frågor > Betyg och bedömning
Ämnesord:
Kunskapsbedömning (pedagogik), Pedagogik, Pedagogisk metodik, Undervisning
Utbildningsnivå:
Lärarfortbildning

Alla program i UR Samtiden - ResearchED 2018

Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - ResearchED 2018

Den svåra uppgiften med prestationsutvärdering

Alla vet att prestationsutvärdering i skolan är utmanande. Jonas Vlachos, professor i nationalekonomi vid Stockholms universitet, berättar här om vad utmaningen verkligen består av. Finns det skillnader mellan kommunala skolor och friskolor? Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Produktionsår:
2018
Utbildningsnivå:
Lärarfortbildning
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - ResearchED 2018

Varför misslyckas bra professionell utveckling?

Det finns en forskningskonsensus om att bra professionell utveckling tar tid och ska fokusera på inlärning. Ändå har en rad nya tester visat att professionell utveckling med hjälp av dessa modeller har haft en begränsad inverkan på lärarutövningen och ingen inverkan på studentresultat. Varför är det så? Harry Fletcher-Wood, biträdande utbildningschef på Institute for teaching i Storbritannien, berättar. Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Produktionsår:
2018
Utbildningsnivå:
Lärarfortbildning
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - ResearchED 2018

Från forskning till praktik

Tom Sherrington har arbetat som lärare och rektor i 30 år. Han är nu utbildningskonsult som specialiserat sig på lärarutveckling, läroplan och bedömningsplanering. Här talar han om vilken resa lärare behöver göra så att deras insikter från forskning omvandlas till praktiska handlingar och beslutsfattande i klassrummen. Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Produktionsår:
2018
Utbildningsnivå:
Lärarfortbildning
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - ResearchED 2018

Minne och mening

Det har funnits två sidor av hur man ser på utbildning. Den ena menar att utbildning är att få eleven att förstå, den andra menar att det är genom memorering som kunskap sitter. Utbildningsdesignern Oliver Caviglioli berättar här om ämnet genom att utforska Daniel Willinghams citat "förståelse är minne i förklädnad". Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Produktionsår:
2018
Utbildningsnivå:
Lärarfortbildning
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - ResearchED 2018

Tillförlitlig bedömning av valfria ämnen

Valfria ämnen, som essäer, är mer autentiska men svårare att bedöma på ett tillförlitligt sätt. Daisy Christodoulou är utbildningsdirektör vid No more marking. Hon arbetar nära skolor med att utveckla nya metoder för bedömning. Här hör du hur hon anser man kan möta denna utmaning. Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Produktionsår:
2018
Utbildningsnivå:
Lärarfortbildning
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - ResearchED 2018

Skapa skolkultur

Det finns bevis som tyder på att det som många lärare har blivit ombedda att ägna sig åt i klassrummen varit högst ineffektivt och i värsta fall slöseri med tid. Detta har lett till en ofta ohållbar nivå av arbetsbelastning och lärarutbrändhet. Tom Bennett, grundare av ResearchEd och rådgivare för utbildningsdepartementet i Storbritannien, försöker peka ut de väsentliga komponenterna i ett framgångsrikt klassrum baserat på forskning. Inspelat den 10 mars 2018 på Fredrika Bremergymnasiet i Haninge. Arrangör: ResearchED.

Produktionsår:
2018
Utbildningsnivå:
Lärarfortbildning
Beskrivning
Visa fler

Mer lärarfortbildning & pedagogiska frågor

Spelbarhet:
UR Skola
Längd
Titta UR Samtiden - Skolforum 2015

Svensk forskning om läsning och läsförståelse

Ett hett samtalsämne bland många pedagoger är barns och ungdomars sjunkande läsförmåga. Hur ser ungdomarna själva på sin läsning och hur tolkar och förstår en ung människa exempelvis en novell? De båda forskarna Christina Olin-Scheller och Michael Tengberg redogör här för de senaste trenderna inom läsforskningen. Inspelat den 26 oktober på Älvsjömässan i Stockholm. Arrangör: Skolforum.

Spelbarhet:
UR Skola
Längd
Lyssna Didaktorn

Våga ta några smällar

Vilken roll ska egentligen förstelärarna spela på landets skolor? Och hur kan de motiveras att våga ta några smällar för skolutvecklingens skull? De frågorna ställer läraren och skolutvecklaren Per Kornhall i sin bok "Förstelärare: en handbok". Han intervjuas av Natanel Derwinger.