Home » Research Data » Basic Knowledge about RDM

Basic Knowledge about RDM

สาระโดยสรุปจากการอบรม Basic Knowledge about Research Data Management (RDM)
โครงการ Mahidol Library Professional Development Program 2020
วันที่ 5 พฤศจิกายน 2562
วิทยากร: ดร.รุจเรขา วิทยาวุฑฒิกุล ผู้อำนวยการหอสมุดและคลังความรู้มหาวิทยาลัยมหิดล


Research Data คืออะไร
ส่วนใหญ่ชาวเราจะคุ้นเคยกับ Research Article หรืองานวิจัยที่เราคอยให้บริการแก่ผู้ใช้อยู่ทุกเมื่อเชื่อวัน ซึ่งงานวิจัยที่ว่านี้คือปลายทางของการวิจัย แต่กว่าจะมาเป็นงานวิจัยต้องผ่านกระบวนการต่าง ๆ มากมาย และยังประกอบด้วยข้อมูล (Data) จำนวนมากที่ผู้วิจัยเก็บรวบรวมค้นคว้ามาใช้ประกอบ ชาวห้องสมุดเองก็ไม่มีทางทราบถึงข้อมูลที่ว่าเหล่านี้ รวมถึงผู้ใช้เองด้วย แต่ปัจจุบันสังคมของนักวิจัยได้ให้ความสำคัญกับ Data เหล่านี้มากขึ้นและเห็นว่าควรจะเผยแพร่สู่สาธารณะ

มีหลายองค์กรได้ให้คำจำกัดความของ RD โดยสรุปแล้วก็คือข้อมูลทุกสิ่งอย่าง ทุกรูปแบบ ที่รวบรวมสะสมไว้เพื่อใช้ในกระบวนการวิจัย จะมีมากน้อยเพียงใดก็ขึ้นอยู่กับผู้วิจัย แต่ RD จำนวนมากนั้นก็ใช่ว่าจะสำคัญไปเสียทั้งหมด เพราะเมื่อนำมาคัดกรองอาจพบว่ามีข้อมูลที่ไม่จำเป็นรวมอยู่ด้วย

RD ที่บอกว่ามีอยู่หลากหลายรูปแบบนั้นเริ่มตั้งแต่ข้อมูลทั่วไปที่เราคุ้นเคย เช่น เอกสาร รายงาน บทความ แต่ยังรวมถึงข้อมูลประเภทอื่น ๆ อีกมากมาย เช่น ตัวเลข สถิติ รูปภาพ แผนที่ บันทึกไดอารี่ เสียงสัมภาษณ์ เพลง ชุดคำสั่ง โปรแกรมคอมพิวเตอร์ ฯลฯ ดังนั้นเราจึงต้องอย่าจำกัดกรอบความหมายของ Data ให้แคบจนเกินไป

นอกจากจะแบ่ง RD ตามลักษณะทางกายภาพแล้ว เรายังแบ่งตามที่มาได้ เช่น ข้อมูลที่มาจากการสังเกต (Observation) ซึ่งก็เป็นวิธีการเก็บข้อมูลอย่างหนึ่ง ข้อมูลจากการสังเกต ไม่จำเป็นต้องทำซ้ำแล้วได้ผลเดิมเสมอไป ต่างจากข้อมูลที่มาจากการทดลอง (Experimental) วิธีนี้จะทำซ้ำได้ มีกระบวนการควบคุม คนอื่นมาทำตามได้ เช่น การทดลองในห้องปฏิบัติการ

Metadata หรือ Data ที่อธิบาย Data ซึ่งเป็นส่วนหนึ่งของข้อมูลก็นับเป็น RD ประเภทหนึ่ง แบ่งออกคร่าว ๆ ได้แก่ 1) Descriptive Metadata เป็นการอธิบายข้อมูลเบื้องต้น เช่น title author keyword 2) Administrative Metadata เป็นข้อมูลเชิงบริหาร เช่น การบ่งบอกสิทธิ์ และ 3) Structural Metadata คือ Metadata ที่สามารถเชื่อมโยงถึงกันได้ นั่นคือจำเป็นต้องมีมาตรฐาน

ดังนั้น RD จึงหมายรวมถึงข้อมูลทุกประเภท รวมถึงองค์ประกอบย่อยที่เป็นส่วนหนึ่งของข้อมูล ก็นับเป็น RD ด้วยเหมือนกัน จากที่เมื่อตีพิมพ์ผลงานแล้วเป็นอันเสร็จ จะไม่ใช่อีกต่อไป เพราะ RD ยังคงมีความสำคัญในทางวิชาการ อีกทั้งกระแสสังคมของการวิจัยที่พยายามจะเปิดเสรีมากขึ้นนั่นเอง


ทำไมต้องจัดการ RD

นักวิจัยไทยส่วนใหญ่ยังไม่ได้จัดการกับ RD อย่างเป็นระบบ ต่างคนต่างเก็บ เก็บกันตามมีตามเกิด รู้กันเองในกลุ่มวิจัย แต่ปัจจุบันจะทำแบบเดิมไม่ได้แล้วเพราะสำนักพิมพ์เริ่มมีระเบียบให้มีการเปิดเผย RD กันแล้ว

  • การจัดการ RD จะช่วยให้นักวิจัยทำงานได้ดีขึ้น เพราะเมื่อ RD ถูกเปิดเผยก็จะทำให้เกิดการแชร์ข้อมูล มีการใช้ข้อมูลร่วมกัน
  • เมื่อข้อมูลเปิดเผยก็จะเป็นการพิสูจน์ถึงความถูกต้อง (ถ้าผิดก็จะมีคนออกมาทักท้วง)
  • RD จะคงมีคุณค่าไปตลอดเพราะถูกจัดเก็บ (Data Repository ที่มีมาตรฐาน)
  • เมื่อถูกจัดเก็บ (อย่างเป็นระบบ) ก็จะค้นหาเจอ เข้าถึงได้
  • ลดกระบวนการการทำวิจัยกรณีที่สามารถใช้ข้อมูลชุดเดียวกันได้
  • ผู้ให้ทุนหรือ สนพ. กำหนดให้ต้องจัดการ

ในทางกลับกันก็ยังมีคนที่เห็นต่างว่า RD ไม่ควรถูกเปิดเผย เพราะมองว่าอาจทำให้เกิดการคัดลอกผลงาน มีค่าใช้จ่ายและเพิ่มกระบวนการทำงานมากขึ้น ข้อมูลบางอย่างมีความละเอียดอ่อนเกินกว่าจะเปิดเผยได้ทั้งหมด เป็นต้น เหล่านี้ก็ยังเป็นที่ถกเถียงกัน แต่สำหรับชาวห้องสมุดจำเป็นต้องทราบว่าหากจะตีพิมพ์หรือขอทุน จะต้องปฏิบัติตามระเบียบและนำเสนอถึงผลดีที่มีมากกว่า

Data Sharing Policy หรือ Public Access Policy คือสองคำที่อาจจะพบบ่อยขึ้น คือข้อตกลงในการเปิดเผย RD สู่สาธารณะ จะพบตามหน่วยงานผู้ให้ทุนซึ่งระบุชัดเจนว่าผู้รับทุนต้องปฏิบัติตามอย่างเคร่งครัด

นอกจากนี้สำนักพิมพ์หลายแห่งก็เริ่มมี Research Data Policies ตัวอย่างเช่น SpringerNature (https://www.springernature.com/gp/authors/research-data-policy) ในนี้จะบอกรายละเอียดทั้งหมดที่ทาง SN ต้องการว่าแบ่งเป็นกี่ประเภท มีตัวอย่างให้ด้วย และยังให้คำแนะนำคลังข้อมูล (Repository) ถึงขั้นที่แนะนำตามสาขาวิชาให้ว่าถ้าเป็นสาขานี้ควรไปเก็บไว้ที่ใด ซึ่งการจัดเก็บในคลังข้อมูลก็นับเป็นกระบวนหนึ่งของการจัดการ RD

แล้วกระบวนการจัดการกับ RD จะทำอย่างไร จึงเกิดคำว่า Data Management Plan (DMPs) คือแผนการที่จะทำอย่างไรกับ Data ที่มี ซึ่งผู้วิจัยต้องอธิบายให้ได้ว่าข้อมูลที่มีนั้นคืออะไรบ้าง แบ่งประเภทตามกายภาพอย่างไร อยู่ใน Format ใด มีที่มาอย่างไร ได้รับอนุญาตจากแหล่งข้อมูลหรือยัง มีระบบการป้องกันอย่างไร จะเอาไปเก็บไว้ที่ไหน มีวิธีการสำรองข้อมูลอย่างไร ฯลฯ (ดูภาพประกอบ)

กระบวนการที่ว่านั้นนอกจากจะอธิบายตามความต้องการของผู้ให้ทุนหรือสำนักพิมพ์แล้ว ยังมีประโยชน์ต่อผู้วิจัยและผู้ที่จะนำข้อมูลไปต่อยอด เพราะกระบวนการต่าง ๆ จะส่งผลกับตัวข้อมูลเพื่อให้แน่ใจว่าข้อมูลนั้นจะคงถูกเก็บรักษาไว้อย่างดี สามารถเข้าถึงได้ ยังคงเปิดใช้งานได้

ถ้ายังสับสนว่าจะเริ่มต้นอย่างไร หลายหน่วยงานมีบริการให้ความรู้เกี่ยวกับ DMP อธิบายว่าลำดับขั้นตอนต้องทำอย่างไร เขียนอย่างไร มีคำแนะนำการจัดการกับข้อมูลประเภทต่าง ๆ รวมถึงมาตรฐานของข้อมูลประเภทต่าง ๆ เช่น

ศึกษาเพิ่มเติมจากสไลด์ของ ดร.รุจเรขา วิทยาวุฑฒิกุล ที่นี่ >> Basic Knowledge about RDM


บทความเพิ่มเติม
น้ำทิพย์ วิภาวิน. (2559). “มาตรฐานการรับรองคุณภาพการจัดการข้อมูลวิจัยในคลังสารสนเทศสถาบันที่เหมาะสมกับมหาวิทยาลัยไทย” วารสารวิจัย. 9(2) ก.ค.-ธ.ค. : 23-39.

เผยแพร่เมื่อปี 2559 เนื้อหายังไม่เก่ามากนัก อาจจะไม่ตรงประเด็นทั้งหมด แต่ช่วยอธิบายทฤษฎีเพื่อให้เราเข้าใจเรื่องการจัดการข้อมูลมากขึ้น เข้าไปโหลดอ่านได้ที่นี่ https://www.tci-thaijo.org/index.php/tla_research/article/view/73664/59382