ปรกติใน linux จะมี uitlity จัดการพวกไฟล์ pdf อยู่เช่น xpdf-utilities หรือ poppler-utilities ถ้ายังไม่มีก็ติดตั้งซะ อาจจะใช้ apt หรือ aptitude เสร็จแล้ว จะมีคำสั่งน่าใช้ อยู่สองคำสั่งคอื pdfimage กับ pdftohtml คำสั่งนึงใช้ดึงรูปออกมาจากไฟล์ pdf ส่วนอีกคำสั่งนึงใช้แปลงเอกสาร pdf เป็น html >$pdfimages example.pdf ./exampleimage เพื่อดึงรูปจากไฟล์ และ >$pdftohtml example.pdf outhtmlfile