บทความนี้จะบอกวิธีนำออกข้อมูล หรือที่เรียกว่า Export ข้อมูลจาก Pandas Dataframe ให้อยู่ในรูป CSV ไฟล์ เพื่อที่จะได้นำไปใช้งานได้ หากใครยังไม่รู้วิธีนำเข้าข้อมูลภายนอก (Import) ไม่ว่าจะเป็นจากไฟล์ CSV, Excel หรือจากเว็บไซต์บนอินเตอร์เน็ต กดที่นี่เพื่อดูบทความนี้ได้เลย วิธีนำเข้าข้อมูลภายนอกเป็น Pandas DataFrame

นำออกข้อมูล DataFrame เป็น CSV

โค้ดที่ใช้สำหรับนำออกข้อมูลโค้ดต่อไปนี้

df.to_csv('file.csv')

พิมพ์โค้ดตัวนี้ แล้วรันโปรแกรม (บน Eclipse ให้กดคลิ้กขวา -> Run As -> Python Run) มันจะนำออกข้อมูลเป็นไฟล์ CSV ในโฟล์เดอร์ที่เราสร้าง PyDev Project คนที่ใช้ IDE Eclipse ไฟล์จะถูกบันทึกไว้ใน Workspce ที่เราเลือกไว้ตอนเปิดโปรแกรม หากไม่ได้เลือกหรือกำหนดโฟล์เดอร์ตอนเปิดโปรแกรม Eclipse จะสร้างโฟลเดอร์ค่าเริ่มต้นให้ มักใช้ชื่อว่า Eclipse-workspace

จากโค้ดด้านบนนี้เมื่อเราเปิดโฟล์ออกมาดู ไฟล์จะมีหน้าตาดังต่อไปนี้

ตัวอย่าง export pandas data frame เป็น csv

จะเห็นว่าในคอลัมน์แรกจะมีตัวเลข index กำกับแต่ละบรรทัด (เรียกว่า row) หากไม่ต้องการไม่มีตัวเลข index ให้เพิ่ม parameter อีกหนึ่งตัวดังต่อไปนี้

df.to_csv('file.csv', index=False)

เมื่อกดรันโปรแกรมก็จะได้ไฟล์ใหม่ที่ไม่มีตัวเลข index ดังตัวอย่างต่อไปนี้

ตัวอย่างนำออก pandas dataframe เป็น csv ไม่มี index

นำออกข้อมูล DataFrame เป็น Excel

ไฟล์ csv เป็นไฟล์ที่ใช้บ่อยที่สุด แต่หลายคนก็อาจจะอยากนำออกไฟล์เป็น Excel เพราะอาจถนัดนำข้อมูลมา manipulate หรือใช้งานบนโปรแกรม Microsoft Excel มากกว่า

โค้ดที่ใช้นำออกข้อมูลเป็น Excel คือ

df.to_excel('file.xlsx')

เหมือนกับการนำออกข้อมูลเป็น CSV หากไม่ต้องการตัวเลข index ก็ให้เพิ่มพารามิเตอร์ index=False เท่านั้นเอง

อย่าลืมว่าทุกครั้งที่กดรันโปรแกรม มันจะ export เป็นไฟล์ที่เราพิมพ์โค้ดไว้ทันที ดังนั้นหากยังจัดเตรียมข้อมูลไม่เสร็จ ก็อย่าเพิ่งพิมพ์โค้ดนี้ในโปรแกรม หรือทางที่ดีกว่านั้นคือใส่เครื่องหมาย # หน้าโค้ดแบบนี้ก็ได้

#df.to_excel('file.xlsx')

เครื่องหมายแบบนี้เรียกว่า comments ใช้เพื่อเอาไว้เขียนอธิบายโค้ดของเราเอง คอมพิวเตอร์จะไม่อ่านบรรทัดที่มีเครื่องหมาย comments กำกับ ดังนั้นจึงมีประโยชน์มากเพื่อเขียนข้อความกันลืมของเราเอง หรือใช้ test โค้ด

Advertisement