Sei sulla pagina 1di 130

MECHERII pentru DOWNLOADAREA ORICROR FIIERE SCRIBD

NOTA Un salut calduros tuturor userilor care posteaza carti corectate. De asemeni, si celor care scaneaza si apoi restrictioneaza downloadul lasand pe cei mai neinstruiti sa saliveze degeaba. Oricum, cei care scaneaza ne ofera astfel (vezi mai jos) materia bruta, pe care o vom perfectiona noi, astilaltii. Daca pdf-ul/documentul a fost postat integral, TOTUL se poate lua de pe scribd, inclusiv fisierele carora nu le este permis downloadul. Iata cum:

1. Pentru pdf-urile din imagini scanate,


Trageti de cursorul din dreapta paginii scribd, si parcurgeti documentul pana jos, imagine cu imagine, lasand-i astfel timp pdf-ului sa isi incarce imaginile jpg in folderul temporar. O faceti cu rabdare, ne-sarind peste vreo pagina, si nici peste vreun grup de pagini. Cand ajungeti jos, dati click dreapta in afara cartii, in campul paginii WEB scribd, de ex. jos - spre dreapta, in apropiere de cursorul din lateralul paginii (nu pe cursor) si, din drop-down list, alegeti VIEW PAGE INFO. Daca nu va apare aceasta optiune, insistati, schimband locul unde dati click dreapta. SIGUR va aparea.

In fereastra urmatoare, apasati butonul MEDIA, care apare in stg sus, alaturi de butonul GENERAL cu oarecare intarziere. Nu disperati, uneori se incarca mai greu, dar apare. In aceasta fereastra veti vedea ca aveti foarte multe fisiere (componente ale HTML, ale paginii web scribd) dintre care multe sunt inutile pt dv. Le alegeti pe cele DENUMITE ca mai jos: (am colorat secventele ''sablon'',ce se vor repeta in celelalte sute de pagini ale cartii, si pe care le veti regasi in josul ferestrei MEDIA, tragand de cursor) http://htmlimg2.scribdassets.com/2tm4dthyv425apiw/images/1-798bdba627.jpg vezi fig de mai jos

tragand de cursorul ferestrei MEDIA, acest ''sablon'' se repeta si pentru restul sutelor de pagini ale cartii. http://htmlimg4.scribdassets.com/2tm4dthyv425apiw/images/2-e47052906c.jpg http://htmlimg3.scribdassets.com/2tm4dthyv425apiw/images/3-55a539a868.jpg vezi fig de mai jos

Intrucat nu am incarcat cartea CORECT, vedeti ca de la imaginea / 9-61c67etc numaratoarea sare la imag.17 apoi de la 24 la 45, etc. Dv veti avea grija sa o faceti corect. ----------Pentru download propriuzis, selectati grupuri de cate 30 - 50 pagini jpg si din fereastra MEDIA - din dreapta jos - apasati butonul SAVE AS, iar fisierele se vor downloada in computer. Functie de procesor si RAM, puteti lua si cate o suta o data, dar uneori vi se poate bloca computerul, mai ales daca e tip mai vechi

La urma, verificati FOLDERUL in care ati downloadat paginile cartii, asigurandu-va ca aveti TOATE fisierele componente ale cartii, urmarind NUMARUL fisierului, mai precis, ultima parte a denumirii fisierului care ESTE de fapt NUMARUL de ordine al paginii cartii. Aducandu-le in computer, paginile se vor redenumi - renumerotandu-le, mai precis, in fata denumirii se adauga doi de ZERO, pt fisierele de ordinul UNITATILOR - de la 1-9, si se adauga un ZERO pt fisierele de ordinul zecilor, de la 10 - 99. Eventualele fisiere lipsa, se iau manual, unul cate unul, ori din fereastra MEDIA, ori chiar direct din SCRIBD din cartea NE-DOWNLOADABILA, mergand direct la pagina lipsa si dand click dreapta pe PAGINA CARTII, SAVE AS jpg. Salvati intotdeauna ca jpg. Paginile sunt de mici dimensiuni, 400-600 pixeliuneori insuficiente pentru un OCR bun, dar solutia este sa instalati un program ACDSEE 7, sau 9, si dati RESIZE acestor pagini, aprox la 4000-5000 pixeli verticala. iar apoi, dupa RESIZE, o prelucrare cu Scan tailor poate reda rezolutia buna paginilor si poate elimina anumite fonduri gri, cetzoase, neuniforme, sau poate indrepta anumite deformari ale paginii (de forma trapezoidala, sau de forma unui paralelogram). (Amanunte in OCR de la A la Z) http://www.scribd.com/doc/119186134/OCR-de-La-A-la-Z-Simplificat-Mart-2012 2. Instructiuni copiere de pe scribd a fisierelor DOC word, pe care nu le puteti downloada, in speta - a celor al caror download este conditionat de uploadarea vreunui document de catre dv - a fisierelor INCOMPLET AFISATE, pentru reclama, care au pagini care nu se afiseaza.

(in memoria cache exista sansa de a descoperi CONTINUTUL INTEGRAL al documentelor puse PARTIAL la vedere, in scop de reclama...)
Prima metoda este prin verificarea CACHEULUI GOOGLE, unde verificam daca putem gasi o copie txt neformatata a documentului cu pricina. Aceasta metoda NU se poate aplica fisierelor doc COMPLET RESTRICTIONATE la download. (dar... exista alte doua metode, la pct 3 si 4, mai jos, un pic mai migaloase, dar perfect posibile). Ca exemplu, iata o carte afisata partial, in scop de reclama... http://www.scribd.com/doc/97071993/Producatorii-de-Gresie Deschideti google, si dati Paste in caseta de cautare pt linkul cu pricina: si apasati ENTER In fereastra urmatoare (GOOGLE) avem rezultatul dorit: apoi - vezi figura: 1. Punem mouseul deasupra simbolului DUBLA SAGEATA 2. Apare fereastra ce ne ofera o imagine grafica micsorata a paginii cautate 3. In dreapta sus, identificam si apasam butonul IN CACHE 4. Ulterior, in fereastra ce se deschide, vi se afiseaza continutul text neformatat si fara ilustratii al fisierului dorit. Cu CTRL+A .... CTRL+C .... CTRL+V, i-ati dat paste in WORD. Pozele le luati cu click dreapta pe fiecare in parte - SAVE AS, iar pentru formatare bold-italic si NOTE DE SUBSOL se foloseste ca model, ORIGINALUL SCRIBD.

3. Instructiuni copiere de pe scribd a fisierelor DOC, interzise la download


Paginile jpg (- poze, coperti) se iau simplu, click pe fiecare pagina/poza si dati SAVE AS. Paginile text (dactilografiate): - sunt codificate/criptate prin substitutie (de catre programatorii angajati la escrocii proprietari ai scribd-ului - care incearca sa vanda papagalilor documentele postate tot de catre NOI - cu cate 3-5 dolari) - se pot lua NUMAI cu copy paste sau PrintScreen, PrtSc - (vezi procedeul la pct. 4), -a. cu copy-paste se pot transfera - asa cum sunt, in forma ''criptata'' - intr-un document word blank doar in numar de CATE PATRU PAGINI O DATA. - b. cu Prt Sc se pot lua numai UNA cate UNA. .... pct. a

Selectarea celor 4 pagini se face astfel: Puneti mouse-ul cu click stanga la inceputul paginii 1 de copiat, (INAINTE DE PRIMUL CARACTER al paginii 1) apoi tineti tasta SHIFT apasat, si coboriti CU RABDARE cursorul PAGINII WEB (din lateral dreapta), numarand paginile pana la sfarsitul paginii 4 - DUPA ultimul caracter, unde puneti mouse-ul si apasati click stanga. In acest moment ati selectat cele PATRU PAGINI (se inalbastreste textul scribd). Dati click dreapta pe portiunea selectata si alegeti COPY, apoi mergeti in documentul word blank si dati PASTE. In documentul cules brut, textul scribd luat cu copy paste este transpus cu font de 121, deci foarte mare. Il formatati dv la font de 12-14. Apoi, dupa adunarea si lipirea cu copy-paste a tuturor GRUPURILOR de cate patru pagini criptate, accesati originalul scribd, identificati fiecare caracter din ORIGINAL in paralel cu corespondentul din COPIA DOC criptatata. - faceti un tabel separat cu corespondentele respective, pe baza caruia - cu search find and replace in word, inlocuiti in copia doc criptata fiecare din caracterele criptate cu corespondentul lor IN CLAR ... Initial, documentul se formateaza INTEGRAL cu font BLACK, si, dupa fiecare inlocuire, caracterele inlocuite deja de catre dv se selecteaza toate literele DE INLOCUIT (pe rand, succesiv, pe masura ce le inlocuiti) si se formateaza cu FONT ROSU (pentru a le exclude pe viitor din cautare-inlocuire). Ulterior, Cautarea in vederea INLOCUIRII se va da NUMAI si MUSAI pe font BLACK, iar Replace-ul se face cu font rosu, ca sa nu intrati in contradictie cu simbolurile DECRIPTATE DEJA - intrucat criptarea scribd s-a facut in proportie de aprox 70 la suta substituind simbolurile alfabetului LATIN (obisnuit). Iata un exemplu de inlocuire pt simbolul F - (litera majuscula F) ce initial exista scrisa cu font black, Litera care trebuie inlocuita cu L majuscul de font rosu:

Model, tabelul de mai jos, valabil pt documentul http://www.scribd.com/doc/116918654/Fluturele-Alb


Deoarece la oricare alt document criptat Scribd a modificat formula de criptare, aceste operatii nu se pot automatiza, astfel ca identificarea simbolurilor trebuie sa o faceti dv de fiecare data separat pt orice alt document. SIMBOL din Textul scribd luat in copy-paste O A D M E B @ C L I H SE SUBSTITUIE CU: A B C D E F G H I J K

F K G J ^ _ Q T ] U R P S \ Y o a d m e b ` c l i h f k g j ~ q t } u r p

L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w

s | y ' & 8 9 / : + , # >


?

1 4 = 5 2 0 3 <

x y z . , ; : ! ? ^p-dialog ) ( 0 1 2 3 4 5 6 7 8 9 En Dash

La final, documentul se corecteaza dupa originalul scribd, nedownloadabil.

4. O alta metoda - mai simpla decat pct. 3, implica


- sa luati cu PRINT SCREEN fiecare pagina de carte, pe rand,

indiferent de format - doc sau pdf, - sa dati PASTE in PAINT, pe rand, fiecarei pagini de carte si sa o salvati NUMEROTAND-O, ca fisier BMP in PAINT-ul din Windows, - ulterior faceti OCR cu ABBYY, pentru toate pozele cu scris/ilustratii carte, culese astfel. Tasta PrtSc se afla langa tastele functionale F11, F12, aproape de tasta INSERT. In acelasi scop puteti folosi orice program de SCREENSHOT, fiind indicata salvarea ca JPG color. In PAINT salvarea o faceti ca BMP, altfel se pot pierde anumite caracteristici de culoare si claritate ale imaginii, ce vor face imposibil OCR-ul, apoi se va da Resize tuturor pozelor BMP (redimensionare--marire la 4000 de pixeli verticala), apoi, cu ACDSEE, se face conversie in JPG... iar la final OCR. Cam atat... Nu disperati, in orice meserie primii 20 de ani sunt mai dificili, dar trec repede! Mai jos sunt 120 de pagini blank, pentru ca acest document sa apara la cautari scribd SI la CATEGORIA DOC PESTE 100 DE PAGINI, PENTRU A PUTEA FI GASIT DE CAT MAI MULTI USERI interesati.

Potrebbero piacerti anche