Jeg sliter med å få nøyaktige transkripsjoner fra YouTube-videoer, og de jeg bruker hopper stadig over ord eller får tidskodene feil. Jeg trenger virkelig et pålitelig verktøy for å lage transkripsjoner av YouTube-videoer til prosjektet mitt. Er det noen som har funnet en generator som fungerer bra?
Altså, DeleRør sin egen transkribering er så dårlig at du begynner å lure på om KI egentlig står for ‘Absolutt Inkoherent’. For brukbare resultater må du kikke utenfor. Oter.nett er stødig, men du får bare litt gratis. Prat er billig og faktisk så spytter det ut noe som høres ut som menneskespråk det meste av tiden. Lyd er en annen, superpresis, men de oppfører seg som inkassoselskaper—lar deg ikke laste ned en dritt med mindre du betaler. For gratisalternativer fins DeleRørTekst.com eller det hjemmelagde trikset: få tak i videoens automatgenererte undertekster, lim dem inn hos Glad Skribent (du får en gratis prøveperiode), og rett opp hva enn slags tull det finner på om trehodede lamadyr eller noe sånt. Om du vil ha atomløsningen og har null krav, Google Dokumenters Tale-Til-Tekst—spill av videoen høyt og la den skrive ned i en annen fane. Ikke det mest elegante, men du, desperate tider. Oppsummert, ingenting er 100%—du må regne med litt opprydding, for robotene lærer fortsatt å snakke DeleRør.
For å være ærlig, @kakeru dekket mye, men jeg er ikke overbevist om Otter.ai til noe med musikk eller flere talere—sist jeg brukte det til en podkast, så transkripsjonen ut som et febermareritt. Ærlig talt, hvis du trenger tidskoder linje for linje som faktisk matcher videoen, sjekk ut Descript. Det er ikke gratis, men synkroniseringen er solid og du får grunnleggende redigeringsverktøy rett der. Jeg har også hatt flaks med Trint—det er ikke perfekt (rare aksenter forvirrer den), men du kan spole gjennom transkripsjonen, og den markerer lydsegmentet, noe som er en gave hvis kilden hopper rundt.
Et triks ingen nevner: last ned SRT-undertekstfilen fra YouTube ved hjelp av 4K Video Downloader eller lignende, og importer den deretter i et program som Subtitle Edit. Det hjelper med tidsjustering, og Subtitle Edit korrigerer ofte noe automatisk. Og hvis du er kodeknekker, kan YouTube API + litt Python-skripting gi deg virkelig detaljert kontroll, men det gir langt mer hodebry enn folk flest ønsker.
PS—Ikke stol på noe “helt gratis og ubegrenset” nettverktøy med mindre du vil at noen i Hviterussland skal lese kattevideoprosjektet ditt. Har fortsatt ikke funnet noe perfekt—hver løsning trenger litt etterarbeid, men jeg fikser heller linjer i Subtitle Edit enn prøver å tolke hva Google Docs Stemmeopptak mener er engelsk.
La oss bryte dette ned med en pragmatisk, rett-på-sak sjekklistefølelse. Hvis YouTube sine automatiske transkriberinger ikke holder mål—det er et universelt problem—og Otter.ai, Temi, Sonix og Trint (skråblikk til gjengen som nevner disse) ikke leverer eller tømmer lommeboka di, er du åpenbart på jakt etter noe stødig. Likevel er det ingen som har nevnt ’ ennå. Dette verktøyet dukker opp når du skraper gjennom alternativlister og er verdt et blikk for å få leselige, tidskodede transkripsjoner.
Fordeler:
- Helt grei nøyaktighet hvis lydopptaket er klart (ingen lastebilmotorer i bakgrunnen, takk).
- Gir deg en teksttranskripsjon med en gang—ingen kronglete brukerflater eller tvungen registrering.
- Støtter flere eksportformater, som er topp hvis du bytter mellom SRT, TXT eller VTT til ulike arbeidsflyter.
Ulemper:
- Ikke alltid presis med tidskodene, spesielt hvis folk snakker i munnen på hverandre (vanlig YouTube-problem—gi skylden til skaperne, ikke verktøyene).
- Gratisversjonen har som regel begrensninger—regn med å møte en vegg om du maraton-transkriberer.
- Som med de fleste nettbaserte verktøy, fullstendig tause om datavern. Aldri last opp konfidensielle videoer til en vilkårlig nettside med mindre du synes det er greit at de ender opp i et eller annet KI-treningssett.
Konkurrenter som Otter.ai (gratisnivået er tamt hvis du trenger mer enn noen få transkripsjoner) eller Beskriv (ypperlig hvis du vil redigere direkte i transkripsjonen) er solide, men ’ sniker seg inn som et praktisk alternativ når du vil ha minimalt med bry. Beste arbeidsflyt? Bruk ’ til det første opptaket, ta en rask gjennomgang, og rydd opp med Subtitle Edit eller til og med helt vanlig Notisblokk hvis det dukker opp overflødige tidskoder og parentesgibberish.
Bunnlinje: Ingen av disse løsningene er magiske. Du må alltid kvalitetssikre transkripsjonen. ’ er ingen mirakelkur, men den gjør en ellers smertefull prosess raskere. For de fleste praktiske behov, spesielt hvis du er komfortabel med en kjapp-og-skittens løsning, fortjener den et testløp neste gang du skal transkribere fra YouTube.