Jak americká pošta dešifruje nečitelný rukopisTom Scott

Thumbnail play icon
Přidat do sledovaných sérií 5
94 %
Tvoje hodnocení
Počet hodnocení:32
Počet zobrazení:3 100
Když v USA pošlete dopis nebo balíček, bude pravděpodobně zpracováván automatickými třídicími stroji. Co se ale stane, když máte tak nečitelný rukopis, že stroj adresu nerozpozná? Pak přichází na scénu vzdálené kódovací centrum. A tam se Tom vydal, aby si zkusil dešifrovat pár adres.

Přepis titulků

Skoro všechny dopisy poslané v USA se třídí automaticky. Dopis dáte do schránky, odvezou ho do nejbližší pobočky, kde kamery a počítače vyfotí předek obálky, přečtou adresu díky optickému rozeznávání znaků, OCR, a potom to pošlou do správného auta nebo letadla. To vyřeší skoro všechno, dokonce ručně psané dopisy. Ale co když má někdo opravdu špatný rukopis? Nebo obálka zvlhla a inkoust se rozmočil?

Pošta pošle obrázek obálky sem, do vzdáleného kódovacího centra, tzv. RECu, v Salt Lake City. A místní zaměstnanci musí ze škrábanic a fleků vyčíst adresy. Dnes se tu toho moc neděje, v létě je malý provoz, toho využiju a zkusím, jestli by mi tohle šlo. Jsme v posledním vzdáleném kódovacím centru v USA, v roce 1997 jich fungovalo 55 a dohromady dešifrovala za ten rok 19 miliard obrázků.

Technologie OCR se natolik zlepšila, že v roce 2021 jsme jako poslední REC dešifrovali jen 1,2 miliardy obrázků. Dnes u nás pracuje asi 810 zaměstnanců. Za chvíli Toma naučíme, jak u nás zpracovat poštu, a bude to zábava! Musím ještě říct, že vám nesmím ukázat skutečné dopisy ani obálky, nic. Kdybychom náhodou něco natočili, zpětně to rozmažeme. Je to striktně důvěrné.

Navíc nehodlám v YouTube videu zveřejňovat adresy náhodných lidí, obzvlášť, když jsou napsané specifickým rukopisem. To není fajn. Ale mají tu ukázkovou poštu, obálky užívané při školení a to si vyzkouším. Když pošlete dopis, dostane se ke zpracování na pobočku, když stroj nepřečte váš rukopis, někdo z místních doplní ty informace a pošle to zpět na pobočku, kde pokračuje automatický proces. To je mnohem levnější, než kdyby to někdo třídil ručně.

Dobře, co musím udělat? Zadat příjmení a první písmeno jména. Chtěl jsem na klávesnici najít čísla… Tohle není běžná klávesnice. Krom písmen a numerické klávesnice je to celé úplně jiné. Abychom mohli pracovat rychleji, trochu nám klávesnice upravili. Prostřední řada, tedy A, S, D, F a tak, ta funguje také jako čísla, abyste se nemuseli natahovat nahoru.

Jak zadávat vnější část poštovní adresy. Vnější znamená město a stát. Tohle vymyslel Siemens v 90. letech. Rozhodli se, že C-kód znamená PSČ. Vnější je město a stát a vnitřní je ulice. A tohle teď používáte, protože se to tak tehdy rozhodlo.

Abychom zadávání urychlili, napíšeme jen malou část adresy, ta je potom porovnaná s databází existujících adres. Vzadu na serverech máme uložené všechny adresy v USA. Když to zadáte správně, rovnou se to odešle. Pokud to najde více shod, dostanete seznam, ze kterého vyberete, co jste chtěli zadat. To je rychlejší než vypisovat celou adresu.

Zadejte první tři znaky z prvního slova v názvu města, první znak druhého slova a dva znaky zkratky státu nebo teritoria. Tomu se říká pravidlo 3+1, u ulic je to stejné. Zmáčkněte Start, až budete připraveni. Start. Takže to je L, E, T, M, S. Pravidlo 3+1. Když není třetí písmeno, je potřeba mezera. - Jasně.

- Teď se to musí smazat. Takže je to L, E, mezera, T, M, S. - A tlačítko C/S. - Jako město a stát, chápu. Něco se načítá z paměti, něco je naživo, ty „živé“ položky jsou někde na pásu, ty dopisy a balíčky jedou třídicím strojem, když stroji neodpovíme do devadesáti vteřin, vyhodí to do košíku nezpracovaných a někdo to roztřídí ručně. Dopisy strojem projedou jednou, uloží je někde stranou, za pár hodin projedou strojem znovu a očekávají, že jsme do té doby poslali potřebné informace.

Řekl bych, že je to nějaké Dixie Hill. Nevím, jestli je to Dic, nebo Dx. Jo aha, Ox Hill. Jasný. A tohle jsou v tom testu ty nejjednodušší. Bude hůř. Každý rok dostáváme méně dopisů. Méně lidí píše dopisy rukou a technologie OCR se pořád zlepšuje.

Řekl bych, že v 90. letech počítač přečetl méně než půlku adres, dnes je to skoro 99 %. OCR, které čte adresy dnes, má úspěšnost skoro 99 %. Takže k nám přijde to nejhorší 1 % a navíc vylepšujeme zhruba půlku toho 1 %. Naše práce je čím dál těžší, protože se ty adresy stále hůř čtou.

Když se počítač lepší, a stejně to nedokáže přečíst, je pravděpodobné, že je to napsané obecně špatně. Možná se ta adresa nějak poškodila nebo zákazník neměl správné informace. Tady dali jako zkratku Ft Lauderdale. Takže já napíšu FT, nebudu nic opravovat? Napiš to, co zákazník. Neděláme detektivy, nezkoumáme detaily, jen podle pravidel zadáme informace o adrese, které vidíme.

U ulice to funguje podobně, napíšeme všechna čísla a potom 3+1. Směrové slovo ignorujte a zadejte jméno ulice. Pokud není napsané jiné než směrové slovo, zadejte ho. A pravidlo 3+1. Start. Kouknul jsem se dolů, abych našel čísla…

720 W, E, S… Jo, je to West Boulevard, to tam dopíšu a tlačítko ulice. 400 Little Way, ulice. Připojení k internetu zajišťují tři dodavatelé, optická vlákna jsou do budovy vedena na třech různých místech, takže pokud se to někde přeruší, můžeme dál poskytovat služby. Jsme jediné REC v celé zemi. Jsme napojeni na více než 300 třídíren, včetně těch na Guamu, v Anchorage a Junu na Aljašce nebo na Portoriku.

Chce čísla a je v módu C-kódu, takže potřebuje PSČ. PSČ, to je 35804. Hotovo. Když to nepřečte stroj a nerozhodne to ani místní zaměstnanec, pošle to stroj do odmítnutých a pak se tomu věnuje někdo ručně. A když to nepřečtou, vrací se to odesílateli.

Když není zpětná adresa, dostane se to do centra nedoručitelné pošty. Finální test. Jdeme na to. Chce číslo, ale to tu není, takže zadat „Žádné“. Správně. Pak tu máme vnější. To je MOK, mezera, HI, C/S, 2545 HEAD, ulice. Dobrá práce. Jak rychlý bych měl být?

7150 úderů za hodinu. Takovou rychlostí to musím přečíst, dekódovat… Všechno si to zapamatovat je těžší, než jsem čekal. A ten rukopis je dobrý, ani to není rozmazané. A co teprve, když je to vzhůru nohama, otočené nebo balíčky se čtyřma stranama. Průměrně tedy čtyři vteřiny na adresu? Ano, v průměru jedna adresa každé čtyři vteřiny.

Skvělá práce, na to, žes ty pravidla viděl poprvé. - Působivé. - Děkuju. Beru to jako pochvalu. Děkuju mockrát. Překlad: jesterka www.videacesky.cz

Komentáře (1)

Zrušit a napsat nový komentář

Odpovědět

Berou nám práci!

00