ดึงข้อความจากเอกสาร Word ด้วย Python REST API

บทความนี้จะแนะนำวิธีการ ดึงข้อความจากเอกสาร Word ด้วย Python REST API คุณจะได้เรียนรู้วิธี ดึงข้อความจากไฟล์ Word โดยอัตโนมัติด้วย Python Low Code API โดยการกำหนดจุดเริ่มต้นและจุดสิ้นสุดของข้อความที่ต้องการดึงจากไฟล์ Word ที่โหลด คุณสามารถตั้งค่าพารามิเตอร์ช่วงได้หลายวิธีตามที่อธิบายไว้ในบทความนี้

ข้อกำหนดเบื้องต้น

  • {{ไฮเปอร์ลิงก์1}}
  • ดาวน์โหลด Aspose.Words Cloud SDK สำหรับ Python เพื่อแยกช่วงข้อความจากไฟล์ Word
  • ตั้งค่าโครงการโซลูชัน Python ด้วย SDK ข้างต้นเพื่อบันทึกช่วงเป็นสตริง

ขั้นตอนในการแยกข้อความเฉพาะจากเอกสาร Word ด้วย Python REST API

  1. สร้างวัตถุคลาส WordsApi เพื่อแยกช่วงข้อความจากไฟล์ Word
  2. สร้างอินสแตนซ์ของวัตถุ GetRangeTextOnlineRequest และโหลดเนื้อหาไฟล์ Word อินพุตลงไป
  3. ตั้งค่าพารามิเตอร์ช่วงในวัตถุคำขอเพื่อกำหนดจุดเริ่มต้นและจุดสิ้นสุดของช่วงข้อความ
  4. เรียกใช้เมธอด รับช่วงข้อความออนไลน์ เพื่อแยกช่วงของข้อความ
  5. แสดงข้อความจากการตอบสนองที่ส่งคืนโดยการเรียก API

ขั้นตอนข้างต้นอธิบายกระบวนการ ดึงข้อความจาก DOC ด้วย Python Low Code API เริ่มต้นกระบวนการโดยการสร้างอ็อบเจ็กต์คลาส WordsApi โดยใช้รหัสไคลเอ็นต์และรหัสลับ และเริ่มต้นอ็อบเจ็กต์คำขอโดยใช้คลาส GetRangeTextOnlineRequest กรอกพารามิเตอร์เพื่อกำหนดช่วงของข้อความ และนำไปใช้ขณะเรียกใช้เมธอด GetRangeTextOnline() ซึ่งดึงข้อมูลจากไฟล์ต้นฉบับ

โค้ดสำหรับแยกข้อความจาก DOCX ด้วย Python REST API

โค้ดนี้สาธิต วิธีการดึงข้อความจากเอกสาร Word ด้วย Python REST API GetRangeTextOnlineRequest ประกอบด้วยพารามิเตอร์ RangeStartIdentifier และ RangeEndIdentifier ซึ่งสามารถใช้กำหนดช่วงข้อความที่ต้องการดึงและบันทึกในตัวแปรสตริง ใช้ตัวระบุช่วง เช่น page3 แสดงหมายเลขหน้า 3, page3:end แสดงจุดสิ้นสุดของหน้า 3 และ document:end แสดงจุดสิ้นสุดของเอกสาร

บทความนี้สอนวิธีการกำหนดช่วงข้อความในแต่ละหน้าและบันทึกลงในตัวแปรสตริง หากต้องการบันทึกหน้าในไฟล์ Word เป็นรูปภาพ โปรดดูบทความต่อไปนี้: แปลงหน้า Word เป็นรูปภาพด้วย Python REST API

 ไทย