2017.09.07 Thursday
15:21 Buja Dhammapujako invited ก๊อง Kanokchat, ฮิม to the group.
15:22 Buja Dhammapujako ที่เคยคุยเรื่องการประกอบพระไตรปิฏกแปลจากพระไตรปิฏกฉบับย่อ ที่เค้ากำลังดำเนินการอยู่
ทางมูลนิธิพระไตรปิฎกเพื่อประชาชนกำลังเร่งทำไฟล์ให้เรียบร้อยอยู่
15:22 Buja Dhammapujako ระหว่างนี้จึงคิดว่าอยากจะให้ช่วยกันทำเรื่องโครงสร้างพระไตรปิฏกแปลภาษาไทยตัวเต็ม ที่จะต่อกับแกนพระธัมมเจดีย์
ซึ่งหลวงพี่เคยให้นาถถอดข้อมูล จากพระไตรปิฎกฉบับแปลไทยของเวบ 84000.org เรียบร้อยแล้วพร้อมกับสารบัญ
และได้ทำการ upload ขึ้นไว้บน google drive ที่นี่
https://drive.google.com/open?id=0ByD-SwEwhqRVSUVCMUlhODcxUG8
15:22 Buja Dhammapujako อยากให้ฮิมกับก๊อง ช่วยกันดูหน่อย ว่าเราจะทำอย่างไรกันดี และคนอื่นจะได้ช่วยกันคิด
15:23 Buja Dhammapujako เช่นเราอาจจะต้องทำโปรแกรมให้มีธัมมอาสา มาช่วยกันนำข้อมูลไปใส่ไว้ในโครงสร้างที่ต่อกับแกนพระธัมมเจดีย์
16:46 Buja Dhammapujako ฮิมกับก๊อง ต้องช่วยลอง dl ข้อมูลพระไตรปิฎกแปล แล้วจะได้คุยกันต่อ
17:50 ก๊อง Kanokchat Stickers
18:28 ฮิม ลองเปิดมาแล้วครับ
18:29 ฮิม มาเป็น Text เลยครับ
18:30 ฮิม Photos
18:30 ฮิม เป็น txt ไฟล์ folder input เหมือนจะทำเป็น Static HTML ไว้แล้ว … output เก็บ TEXT ตรงๆ
18:32 ฮิม น่าให้คุณเอ นำไปติดไว้ในหน้า PAGE ขณะที่ทำการตรวจจัวสะกดไปเลยนะครับ
18:32 ฮิม ทำเป็น หน้าต่อหน้าไปเลยครับ
18:33 ฮิม มีชิ้นที่เป็น HTML แล้ว กับ TEXT ไฟล์ดิบๆ
18:34 ฮิม ถ้า mapping เล่มหน้า ได้ตรงกับที่เราทำงานกันอยู่ ก็น่าจะเป็นประโยชน์มากเลยครับ
18:51 Buja Dhammapujako หน้าตรงกับพระไตรปิฎกบาลีหรือปล่าว ฮิม
18:52 ฮิม ผมงงกับเลขหน้าครับ หน้าในระบบของเรา เป็นหน้า Scan และผมลองสอบสอบ จำนวนหน้าไม่เท่ากันเลยครับ
18:52 Buja Dhammapujako นั่นสิ หน้าคงไม่จร
18:52 Buja Dhammapujako หน้าคงไม่ตรงกัน
18:53 ฮิม ตัวอย่างเล่ม 2 : ในระบเรา
Volume 2 วินยปิฏเก มหาวิภงฺคสฺส ทุติโย ภาโค location_on Page 1 / 571
ใน Text ไฟล์ ผมเห็น 716 TEXT ไฟล์ครับ
18:56 ฮิม แต่เหมือนชื่อ หัวข้อใน สารบีญ ( content_index.txt ) จะตรงกันครับ
18:59 ฮิม สงสัย อาจต้องมี โปรแกรม Mapping ไฟล์คำแปล หรือเปล่าครับ…
19:02 Buja Dhammapujako ใช่ ประมาณนั้นกระมัง
หรือเรามีขั้นตอนอะไรง่ายๆ ไหม เช่น ให้คนเปิดสองหน้าต่าง แล้วใส่ดรรชีอะไรบางอย่างในตาราง แล้วเราค่อยมาให้โปรแกรมรวมเข้าไปในโครงสร้าง
ไม่ต้องเป็นโปรแกรมอะไรเต็มรูปแบบ
19:02 Buja Dhammapujako ดรรชนี
19:03 ฮิม ใช่ครับ ผมว่า map หน้ากับเล่ม ไม่ต้องทำ โปรแกรมก็ได้ครับ อาจจะทำตารางอ้างอิงใน WorkSheet ก็ยังได้ครับ…
แต่ต้องอ่าน บาลี พอได้ครับ
19:06 ฮิม เพียงแค่นี้ผมว่าทีม developer ก็ทำ Link ไปเปิด Text ไฟล์คำแปลได้แล้วครับผม
19:07 Buja Dhammapujako เดี๋ยวรอความเห็นคนอื่นบ้าง
19:07 ฮิม Stickers
19:11 นาถ Natnaka เห็นด้วย ครับแต่ ควรสามารถกำหนดเป็น range ของหน้าได้เนื่องจากเนื้อหา มันย่อขยายความ จำนวนหน้าจะคร่อมๆกันอยู่
19:50 Buja Dhammapujako เลขข้อ มันตรงกันไหม
19:53 นาถ Natnaka คิดว่าน่าจะตรงนะครับต้องไล่ตรวจทานดู ถ้าหมายถึงตามหัวข้อเรื่อง
19:53 นาถ Natnaka แต่ถ้าลงลึกย่อยกว่านั้น ต้องผู้รู้บาลี
19:59 นาถ Natnaka น่าจะประมาณนี้ครับในมุมของผม
2017.09.08 Friday
12:55 Buja Dhammapujako นาถถอดข้อมูล จากพระไตรปิฎกฉบับแปลไทยของเวบ 84000.org เรียบร้อยแล้วพร้อมกับสารบัญ
แล้วสารบัญมันอยู่ตรงไหนน่ะ นาถ
12:57 Buja Dhammapujako หลวงพี่เข้าไปดูไฟล์อีกที มันฝังอยู่ใน html ไฟล์ใช่ไหม
12:57 Buja Dhammapujako Photos
13:01 Buja Dhammapujako จะปรึกษากันว่า แล้วจะทำเนื้อหาพระไตรปิฎกแปล ให้เป็นโครงสร้างอย่างไร ที่จะประกอบกับแกนบาลี
13:03 ฮิม folder output จะไม่ฝัง html และมีไฟล์ content.txt ครับผม
13:04 Buja Dhammapujako อ้อ เห็นแล้ว ฮิม
13:05 Buja Dhammapujako Photos
13:06 Buja Dhammapujako แต่ที่มันฝังอยู่ในไฟล์ อย่างที่ขีดเส้นสีแดงข้างบน ก็น่าจะดีนะ เพราะมันบอกโครงสร้างของเนื้อหาด้วย
13:21 เอ อริยะ พี่ฮิมแนะนำให้เอาไปไว้ใน pages ใช่ไหม น่าจะเป็นสิ่งที่ทำได้มากที่สุดในตอนนี้
13:22 เอ อริยะ Photos
13:23 Buja Dhammapujako เป้าหมายคือ เราต้องการเอาเนื้อพระไตรปิฎกแปล ทำเป็นฐานข้อมูล ที่ประกอบเข้ากันได้กับแกนบาลี
13:25 เอ อริยะ ตอนแรก ผมตั้งใจจะไป annotate เลย
13:25 เอ อริยะ ทำเรื่องนี้แหละ แต่ใช้การ annotate
13:25 Buja Dhammapujako annotate ซ้อนลงไปที่ไหน
13:25 เอ อริยะ ที่ แปล อ้างกลับไปที่ แกน
13:26 Buja Dhammapujako แล้วถ้า 84000.org หายไปล่ะ
13:28 เอ อริยะ ถ้าไปแนว annotate ก็ต้องเร่ิมจากที่ปลายทาง
13:28 Buja Dhammapujako เราน่าจะต้องมีฐานข้อมูลหลักๆ ของพระธัมมเจดีย์เอง และอยู่ใน Archetecture ที่รองรับการแปลหลายเวอร์ชั่นในอนาคต
13:29 Buja Dhammapujako เราสร้าง “ปลายทาง” ของเราเอง แล้วใช้ annotate ได้ไหม
13:30 เอ อริยะ คงต้องทำอย่างนั้น หลวงพี่
13:31 เอ อริยะ ข้อมูลแปลมาจากธรรมทานใช่ไหมครับ
13:31 Buja Dhammapujako ดังนั้น “ปลายทาง” ของเรา เช่นในกรณีนี้ คือพระไตรปิฎกแปล ควรจะมีโครงสร้างอย่างไร
13:32 Buja Dhammapujako มาจาก 84000 ก็คงเอามาจากพระไตรปิฏกฉบับธรรมทาน
13:32 Buja Dhammapujako จากฉบับมหามกุฏฯ
13:33 เอ อริยะ ข้อมูลประมาณเท่าไหร่ครับ ผมคิดว่าจะ Host ที่ firebase 5 GB ไปเลย
13:33 เอ อริยะ เอาโครงสร้างตามเดิม
13:37 เอ อริยะ ก็ต้องทำเหมือน ของหลวงตาบัวนั่นแหละ นะ
13:37 Buja Dhammapujako น่าจะประมาณ 100 M
13:38 Buja Dhammapujako ใช่ อะไรที่ทำเหมือนกันได้ ก็ควรจะให้เหมือนกัน
13:39 เอ อริยะ จะให้เด็กๆ ที่จะไปพบหลวงพี่ ทำได้ไหม จะได้ขนานกันไป
13:41 Buja Dhammapujako ได้ทั้งนั้นแหละ เอ
แต่ตอนนี้เราต้องช่วยกันออกแบบก่อนหรือปล่าว ว่าจะเป็นอย่างไร และจะมีขั้นตอนการแปลงไฟล์ข้อมูลดิบ เข้าไปอยู่ในโครงสร้างอย่างไร
13:42 เอ อริยะ คือ ปลายทางอย่าง 84000 จะเป็นอย่างไรก็ได้
13:42 เอ อริยะ แต่เราจะ plugin annotate เข้าไปทีหลัง
13:42 เอ อริยะ แต่ถ้าเรามีเว็บของเราเอง ก็จะทดลอ
13:42 เอ อริยะ ทดลองได้่
13:43 เอ อริยะ ฐานข้อมูล นาถแปลงมาให้แล้วและโครงสร้างพระไตรปิฎกเดิมก็ใช้ได้อยู่ครับ
13:44 Buja Dhammapujako การ annotate อาจจะต้องเป็น semi-automate หรือปล่าว คือโปรแกรมทำให้ส่วนใหญ่ แล้วให้ธัมมอาสาตรวจเช็ค
13:45 เอ อริยะ การ annotate ก็ต้องทำฝั่งแกนเราก่อน ไม่งั้นไม่รู้จะอ้างอิงอย่างไง
13:45 เอ อริยะ ต้องวางแผนฝั่งนี้มากกว่า
13:46 เอ อริยะ ส่วนการ annotate อาจจะให้ อาสามาทำก็ได้
13:46 เอ อริยะ แต่เราเชื่อมกันให้ก่อน
13:47 ฮิม ผมคิดว่า link เป็นหน้า หรือ range ของหน้า ก็น่าจะพอนะครับ… เพราะถ้าแปลเป็นท่อน เป็นคำ ต้องใช้กำลัง ธรรมะอาสาที่รู้บาลีนะครับ
13:47 เอ อริยะ ครับ เป็นการเริ่มต้นที่เพียงพอ จะได้ทดสอบด้วย
13:49 Buja Dhammapujako Stickers
14:16 Buja Dhammapujako หลวงพี่ลองเทียบดูแล้ว หมายเลขข้อในไฟล์พระไตรปิฎกแปล ตรงกับหมายเลขข้อของพระไตรปิฎกบาลี
14:27 เอ อริยะ เคครับ