Ngimpor data saka PDF menyang Excel liwat Power Query

Tugas nransfer data saka spreadsheet ing file PDF menyang lembar Microsoft Excel tansah "nyenengake". Utamane yen sampeyan ora duwe piranti lunak pangenalan sing larang kaya FineReader utawa liya-liyane. Nyalin langsung biasane ora nggawa apa-apa sing apik, amarga. sawise nempelake data sing disalin ing lembaran kasebut, mesthine bakal "kelet bebarengan" dadi siji kolom. Dadi, dheweke kudu dipisahake kanthi tliti kanthi nggunakake alat Teks kanthi kolom saka tab Data (Data - Teks menyang Kolom).

Lan mesthine, nyalin mung bisa kanggo file PDF sing ana lapisan teks, yaiku kanthi dokumen sing mentas dipindai saka kertas menyang PDF, iki ora bakal bisa digunakake.

Nanging ora dadi sedih, tenan 🙂

Yen sampeyan duwe Office 2013 utawa 2016, banjur ing sawetara menit, tanpa program tambahan, sampeyan bisa mindhah data saka PDF menyang Microsoft Excel. Lan Word lan Power Query bakal mbantu kita ing babagan iki.

Contone, ayo njupuk laporan PDF iki kanthi akeh teks, rumus lan tabel saka situs web Komisi Ekonomi Eropa:

Ngimpor data saka PDF menyang Excel liwat Power Query

... lan coba tarik metu saka Excel, ucapake tabel pisanan:

Ngimpor data saka PDF menyang Excel liwat Power Query

Ayo ayo!

Langkah 1. Bukak PDF ing Word

Kanggo sawetara alasan, sawetara wong ngerti, nanging wiwit 2013 Microsoft Word wis sinau mbukak lan ngenali file PDF (malah sing dipindai, yaiku, tanpa lapisan teks!). Iki rampung kanthi cara standar: mbukak Word, klik File - Bukak (File - Bukak) lan nemtokake format PDF ing dhaptar gulung mudhun ing pojok tengen ngisor jendhela.

Banjur pilih file PDF sing dibutuhake lan klik Open (Mbukak). Word ngandhani yen bakal mbukak OCR ing dokumen iki dadi teks:

Ngimpor data saka PDF menyang Excel liwat Power Query

Kita setuju lan ing sawetara detik kita bakal weruh PDF mbukak kanggo diowahi wis ana ing Word:

Ngimpor data saka PDF menyang Excel liwat Power Query

Mesthine, desain, gaya, font, header lan footer, lan liya-liyane bakal mabur sebagian saka dokumen kasebut, nanging iki ora penting kanggo kita - kita mung butuh data saka tabel. Ing asas, ing tahap iki, wis nggodho mung nyalin tabel saka dokumen sing diakoni menyang Word lan mung nempelake menyang Excel. Kadhangkala kerjane, nanging luwih kerep ndadékaké kabeh jinis distorsi data - contone, angka bisa dadi tanggal utawa tetep teks, kaya ing kasus kita, amarga. PDF nggunakake non-pemisah:

Ngimpor data saka PDF menyang Excel liwat Power Query

Dadi ayo ora dipotong, nanging nggawe kabeh luwih rumit, nanging bener.

Langkah 2: Simpen Dokumen minangka Kaca Web

Banjur mbukak data sing ditampa menyang Excel (liwat Power Query), dokumen kita ing Word kudu disimpen ing format kaca web - format iki, ing kasus iki, jenis denominator umum antarane Word lan Excel.

Kanggo nindakake iki, pindhah menyang menu File - Simpen Minangka (File - Simpen Minangka) utawa pencet tombol F12 ing keyboard lan ing jendhela sing mbukak, pilih jinis file Kaca web ing siji file (Kaca web - File tunggal):

Ngimpor data saka PDF menyang Excel liwat Power Query

Sawise nyimpen, sampeyan kudu entuk file kanthi ekstensi mhtml (yen sampeyan ndeleng ekstensi file ing Explorer).

Tahap 3. Ngunggah file menyang Excel liwat Power Query

Sampeyan bisa mbukak file MHTML sing digawe ing Excel langsung, nanging banjur kita bakal entuk, sepisanan, kabeh isi PDF bebarengan, bebarengan karo teks lan akeh tabel sing ora perlu, lan, kaping pindho, kita bakal kelangan data maneh amarga salah. pemisah. Mula, kita bakal ngimpor menyang Excel liwat add-in Power Query. Iki minangka tambahan gratis sing bisa sampeyan upload data menyang Excel saka meh kabeh sumber (file, folder, database, sistem ERP) lan banjur ngowahi data sing ditampa kanthi cara sing bisa, menehi wangun sing dikarepake.

Yen sampeyan duwe Excel 2010-2013, sampeyan bisa ndownload Power Query saka situs web Microsoft resmi - sawise instalasi sampeyan bakal weruh tab. Pitakonan Daya. Yen sampeyan duwe Excel 2016 utawa luwih anyar, sampeyan ora perlu ndownload apa-apa - kabeh fungsi wis dibangun ing Excel kanthi standar lan ana ing tab. Data (Tanggal) ing grup Ngundhuh lan Ngonversi (Get & Transform).

Dadi kita pindhah menyang tab Data, utawa ing tab Pitakonan Daya lan milih tim Kanggo entuk data or Gawe Pitakonan - Saka File - Saka XML. Supaya katon ora mung file XML, ganti saringan ing dhaptar gulung mudhun ing pojok tengen ngisor jendhela menyang Kabeh file (Kabeh file) lan nemtokake file MHTML kita:

Ngimpor data saka PDF menyang Excel liwat Power Query

Elinga yen impor ora bakal rampung kanthi sukses, amarga. Power Query ngarepake XML saka kita, nanging kita duwe format HTML. Dadi, ing jendela sabanjure sing katon, sampeyan kudu klik-tengen ing file sing ora dingerteni Power Query lan nemtokake format:

Ngimpor data saka PDF menyang Excel liwat Power Query

Sawise iku, file kasebut bakal dikenali kanthi bener lan kita bakal weruh dhaptar kabeh tabel sing ana:

Ngimpor data saka PDF menyang Excel liwat Power Query

Sampeyan bisa ndeleng isi tabel kanthi ngeklik tombol mouse kiwa ing latar mburi putih (ora ing tembung Tabel!) saka sel ing kolom Data.

Nalika tabel sing dikarepake ditetepake, klik ing tembung ijo Tabel - lan sampeyan "tumindak" menyang isine:

Ngimpor data saka PDF menyang Excel liwat Power Query

Iku tetep kanggo nindakake sawetara langkah prasaja kanggo "sisir" isine, yaiku:

  1. mbusak kolom sing ora perlu (klik-tengen ing header kolom - mbusak)
  2. ngganti titik karo koma (pilih kolom, klik-tengen - Ngganti nilai)
  3. mbusak tandha sing padha ing header (pilih kolom, klik-tengen - Ngganti nilai)
  4. mbusak baris ndhuwur (Home – Busak garis – Busak garis ndhuwur)
  5. mbusak garis kosong (Ngarep - Busak baris - Busak baris kosong)
  6. ngunggahake baris pisanan menyang header tabel (Ngarep - Gunakake baris pisanan minangka judhul)
  7. nyaring data sing ora perlu nggunakake saringan

Nalika meja digawa menyang wangun normal, bisa dibongkar menyang sheet kanthi printah nutup lan download (Tutup & Muat) on Utama tab. Lan kita bakal entuk kaendahan sing bisa ditindakake:

Ngimpor data saka PDF menyang Excel liwat Power Query

  • Ngowahi Kolom menyang Tabel kanthi Power Query
  • Pisah teks lengket dadi kolom

Ninggalake a Reply