Ištraukite tekstą iš paveikslėlių savo naršyklėje. Palaiko 100+ kalbų – be įkėlimo, veikia lokaliai.
Įkelkite paveikslėlį, kuriame yra tekstas (dokumento nuotrauka, ekrano kopija, kvitas ir kt.). Pasirinkite teksto kalbą ir spustelėkite „Atpažinti tekstą”. Ištrauktas tekstas pasirodo rezultatų panelėje – galite jį nukopijuoti ar atsisiųsti.
OCR (optinis simbolių atpažinimas) yra technologija, kuri skaito paveikslėliuose esantį tekstą ir paverčia jį redaguojamu, ieškomu tekstu. Užuot perkeldami nuskaitytą dokumentą ar ekrano kopijąų, paleidžiate jį per OCR įrankį ir per sekundes gausite tekstą.
Šiuolaikiniai OCR varikliai naudoja šablonų atpažinimą ir mašininį mokymąsi simboliams, žodžiams ir išdėstymui aptikti. Naršyklėje pagrįstas teksto atpažinimas iš paveikslėlio ocr veikia visiškai jūsų įrenginyje – jūsų paveikslėliai niekada neįkeliami į serverį, todėl jūsų dokumentai išlaikomi privatūs ir veikia neprisijungę po pirmojo įkėlimo.
OCR programinė įranga analizuoja paveikslėlio pikselius, aptinka teksto turinčias sritis ir paverčia jas mašinai skaitomais simboliais. Procesas paprastai apima:
Paveikslėlio išankstinis apdrojimas: Paveikslėlis gali būti ištiesinamas, apkarpomas ar konvertuojamas, kad pagerintų kontrastą, kad tekstas išsiskirtų iš fono.
Teksto aptikimas: Variklis nustato eilutes, žodžius ir simbolių sritis naudodamas išdėstymo analizę.
Atpažinimas: Kiekvienas simbolis ar žodis lyginamas su apmokytais modeliais pasirinktai kalbai, gaunant galutinę teksto išvestį.
Nuo kasdienių dokumentų iki prieinamumo ir daugiakalbio turinio, OCR turi daug praktinių panaudojimų:
Skaitmeninti dokumentus: Paverskite nuskaitytus sutartis, formas ar spausdinamus puslapius tekstu, kurį galite redaguoti, ieškoti ir archyvuoti.
Prieinamumas: Padarykite paveikslėliuose esantį tekstą prieinamą ekrano skaitytuvams ir pagalbinėms technologijoms, arba konvertuokite ženklus ir etiketes į skaitomą formatą.
Daugiakalbis tekstas: Ištraukite tekstą daugeliu kalbų – pasirinkite teisingą kalbą įrankyje geresniam tikslumui.
Privatumas pirmiausia: Kai OCR veikia jūsų naršyklėje, jūsų paveikslėliai niekada nepalieka jūsų įrenginio – debesų įkėlimas nereikalingas.
Geriausiems rezultatams naudokite aiškius, gerai apšviestus paveikslėlius. Šie formatai paprastai palaikomi naršyklėje pagrįstame OCR:
PNG: Be nuostolių formatas, idealiai tinkantis ekrano kopijoms ir diagramoms su tekstu.
JPEG: Plačiai naudojamas dokumentų nuotraukoms; venkite stipraus suspaudimo, kad tekstas išliktų aštrus.
WebP: Modernus formatas, palaikomas daugumoje naršyklių; geras kokybės ir dydžio balansas.
BMP: Nesuspaustas bitmapas; tinka, kai kokybė yra svarbiau už failo dydį.
Skirtumų supratimas padeda pasirinkti tinkamą įrankį:
Naršyklėje pagrįstas OCR: Nereikia diegti, veikia bet kuriame įrenginyje su šiuolaikine naršykle. Jūsų failai lieka jūsų įrenginyje. Idealiai tinka greitoms ekstrakcijoms, retam naudojimui ir kai negalite įdiegti programinės įrangos.
Stalinio kompiuterio OCR programinė įranga: Dažnai siūlo paketinį apdrojimą, PDF palaikymą ir išplėstines išdėstymo parinktis. Reikia diegti, ir duomenys gali būti siunčiami į serverį priklausomai nuo produkto. Geriausia didelės apimties ar įmonės darbo eigoms.
Dažni teksto ištraukimo iš paveikslėlių atvejai:
Dokumentai: Skaitmeninkite nuskaitytus puslapius, formas ar spausdinamus dokumentus į redaguojamą tekstą.
Ekrano kopijos: Ištraukite tekstą iš ekrano kopijų ar vartotojo sąsajos užfiksuojamų vaizdų pakartotiniam naudojimui ar vertimui.
Kvitai ir etiketės: Gaukite tekstą iš kvitų, produktų etikečių ar ženklų įrašams ar paieškai.
Prieinamumas: Padarykite paveikslėliuose esantį tekstą skaitomu ekrano skaitytuvams ar vertimui.
OCR naudojamas įvairiose pramonės šakose ir kasdienėse užduotyse:
Verslas ir teisė: Sutarčių, sąskaitų faktūrų ir archyvų skaitmeninimas paieškai ir atitikčiai.
Švietimas: Vadovėlių ir handautų pavertimas prieinamais, ieškomais formatais.
Sveikatos priežiūra: Duomenų ištraukimas iš receptų, laboratorinių ataskaitų ir medicinos formų.
Mažmeninė prekyba ir logistika: Brūkšninių kodų, etikečių ir siuntimo dokumentų nuskaitymas inventoriui ir sekimui.
Gaukite geriausius rezultatus iš savo OCR įrankio su šiais paprastais patarimais:
Paveikslėlio kokybė: Naudokite aiškius, gerai apšviestus paveikslėlius. Neryškios ar mažos raiškos nuotraukos mažina tikslumą.
Atitinkanti kalba: Pasirinkite paveikslėlyje esančio teksto kalbą. Neteisinga kalba lemia nesąmonę ar praleistą tekstą.
Geras kontrastas: Tekstas turi išsiskirti iš fono. Venkite stiprių šešėlių ar vandens ženklų ant teksto.
Palaikomi formatai: PNG, JPEG ir WebP veikia gerai. Išlaikykite failo dydį protingą greitesniam apdrojimui.
Laikykitės šių gairių, kad pagerintumėte atpažinimo kokybę:
Naudokite didelę raišką: Neryškios ar mažos raiškos paveikslėliai lemia neteisingai atpažintus simbolius. Nuskaitytiems dokumentams siekite bent 300 DPI.
Užtikrinkite gerą apšvietimą: Venkite šešėlių ir atspindžių. Plokščias, tolygus apšvietimas pagerina tikslumą.
Pasirinkite teisingą kalbą: Įrankio kalbos nustatymas turi atitikti paveikslėlyje esantį tekstą. Mišrių kalbų dokumentams gali reikėti kelių praėjimų.
Ištiesinkite paveikslėlį: Kreivą ar pasvirusį tekstą sunkiau atpažinti. Sulygiuokite fotoaparatą arba apkarpykite iki teksto srities.
Sumažinkite triukšmą: Švarūs fonai ir aiškūs šriftai veikia geriausiai. Ranka rašytas tekstas ir dekoratyviniai šriftai yra mažiau tikslūs nei spausdintasis tekstas.
Naršyklėje pagrįstas teksto atpažinimas iš paveikslėlio ocr įrankis yra greitas, privatus ir veikia nediegiant programinės įrangos ar nesukuriant paskyros.
Veikia jūsų naršyklėje: Nereikia diegti, registruotis. Atidarykite puslapį, įkelkite paveikslėlį ir gaukite tekstą.
Jūsų duomenys lieka privatūs: Paveikslėliai apdrojami jūsų įrenginyje. Niekas nesiunčiama į mūsų serverius.
Daug kalbų: Rinkitės iš 100+ kalbų tiksliam dokumentų ir ženklų atpažinimui iš viso pasaulio.
Kopijuoti ar atsisiųsti: Naudokite ištrauktą tekstą bet kurioje programoje – įklijuokite į dokumentą, išsaugokite kaip failą ar perduokite vertimo įrankiams.
OCR (optinis simbolių atpažinimas) paverčia paveikslėliuose esantį tekstą į redaguojamą tekstą. Šis įrankis veikia visiškai jūsų naršyklėje – be įkėlimo į serverį.
Ne. Visas apdrojimas vyksta jūsų naršyklėje. Jūsų paveikslėlis niekada nepalieka jūsų įrenginio.
Palaikomi įprasti formatai, tokie kaip PNG, JPEG, WebP ir BMP. Geriausiems rezultatams naudokite aiškius, gerai apšviestus paveikslėlius su skaitomu tekstu.
Tikslumas priklauso nuo paveikslėlio kokybės, šrifto aiškumo ir kalbos nustatymo. Naudokite aiškų paveikslėlį, pasirinkite teisingą kalbą ir venkite mažos raiškos ar stipriai stilizuoto teksto.
OCR yra optimizuotas spausdintam tekstui. Rankraščio atpažinimas yra mažiau patikimas ir gali reikėti specializuotų įrankių. Geriausiems rezultatams su šiuo įrankiu naudokite aiškų spausdintą ar mašinraštinį tekstą.
Labai dideli paveikslėliai gali užtrukti ilgiau arba būti ribojami jūsų įrenginio atminties. Geresniam našumui naudokite paveikslėlius, mažesnius nei keli megabaitai, ir apkarpykite iki atitinkamos teksto srities.
Nufotografuokite kvitą ar sąskaitą faktūrą, įkelkite čia ir pasirinkite teisingą kalbą. Per sekundes gausite paprastą tekstą, kurį galite įklijuoti į skaičiuoklę ar išlaidų sekimo programą.
Naudojimo atvejis: Išlaidų sekimas ir įrašai
Turite ekrano kopiją su svarbiu tekstu – citata, klaidos pranešimu ar fragmentu iš programos. Įkelkite paveikslėlį, atpažinkite tekstą ir nukopijuokite jį į savo pastabas ar pagalbos bilietą.
Naudojimo atvejis: Dokumentacija ir palaikymas
Ženklų, meniu ar etikečių nuotraukos kita kalba gali būti paverstos tekstu, tada išverstos ar balsu perskaitomos. Pasirinkite šaltinio kalbą geresniam tikslumui.
Naudojimo atvejis: Vertimas ir prieinamumas