บทความนี้จะบอกวิธีนำออกข้อมูล หรือที่เรียกว่า Export ข้อมูลจาก Pandas Dataframe ให้อยู่ในรูป CSV ไฟล์ เพื่อที่จะได้นำไปใช้งานได้ หากใครยังไม่รู้วิธีนำเข้าข้อมูลภายนอก (Import) ไม่ว่าจะเป็นจากไฟล์ CSV, Excel หรือจากเว็บไซต์บนอินเตอร์เน็ต กดที่นี่เพื่อดูบทความนี้ได้เลย วิธีนำเข้าข้อมูลภายนอกเป็น Pandas DataFrame
นำออกข้อมูล DataFrame เป็น CSV
โค้ดที่ใช้สำหรับนำออกข้อมูลโค้ดต่อไปนี้
df.to_csv('file.csv')
พิมพ์โค้ดตัวนี้ แล้วรันโปรแกรม (บน Eclipse ให้กดคลิ้กขวา -> Run As -> Python Run) มันจะนำออกข้อมูลเป็นไฟล์ CSV ในโฟล์เดอร์ที่เราสร้าง PyDev Project คนที่ใช้ IDE Eclipse ไฟล์จะถูกบันทึกไว้ใน Workspce ที่เราเลือกไว้ตอนเปิดโปรแกรม หากไม่ได้เลือกหรือกำหนดโฟล์เดอร์ตอนเปิดโปรแกรม Eclipse จะสร้างโฟลเดอร์ค่าเริ่มต้นให้ มักใช้ชื่อว่า Eclipse-workspace
จากโค้ดด้านบนนี้เมื่อเราเปิดโฟล์ออกมาดู ไฟล์จะมีหน้าตาดังต่อไปนี้

จะเห็นว่าในคอลัมน์แรกจะมีตัวเลข index กำกับแต่ละบรรทัด (เรียกว่า row) หากไม่ต้องการไม่มีตัวเลข index ให้เพิ่ม parameter อีกหนึ่งตัวดังต่อไปนี้
df.to_csv('file.csv', index=False)
เมื่อกดรันโปรแกรมก็จะได้ไฟล์ใหม่ที่ไม่มีตัวเลข index ดังตัวอย่างต่อไปนี้

นำออกข้อมูล DataFrame เป็น Excel
ไฟล์ csv เป็นไฟล์ที่ใช้บ่อยที่สุด แต่หลายคนก็อาจจะอยากนำออกไฟล์เป็น Excel เพราะอาจถนัดนำข้อมูลมา manipulate หรือใช้งานบนโปรแกรม Microsoft Excel มากกว่า
โค้ดที่ใช้นำออกข้อมูลเป็น Excel คือ
df.to_excel('file.xlsx')
เหมือนกับการนำออกข้อมูลเป็น CSV หากไม่ต้องการตัวเลข index ก็ให้เพิ่มพารามิเตอร์ index=False เท่านั้นเอง
อย่าลืมว่าทุกครั้งที่กดรันโปรแกรม มันจะ export เป็นไฟล์ที่เราพิมพ์โค้ดไว้ทันที ดังนั้นหากยังจัดเตรียมข้อมูลไม่เสร็จ ก็อย่าเพิ่งพิมพ์โค้ดนี้ในโปรแกรม หรือทางที่ดีกว่านั้นคือใส่เครื่องหมาย # หน้าโค้ดแบบนี้ก็ได้
#df.to_excel('file.xlsx')
เครื่องหมายแบบนี้เรียกว่า comments ใช้เพื่อเอาไว้เขียนอธิบายโค้ดของเราเอง คอมพิวเตอร์จะไม่อ่านบรรทัดที่มีเครื่องหมาย comments กำกับ ดังนั้นจึงมีประโยชน์มากเพื่อเขียนข้อความกันลืมของเราเอง หรือใช้ test โค้ด