จากตัวแยกวิเคราะห์ Nokogiri HTML สำหรับทับทิม Sanitize เป็นระบบบัญชีขาวที่ใช้สำหรับการลบ HTML จากบล็อกของข้อความ
"รายการที่อนุญาต" เทคนิคที่จะช่วยให้นักพัฒนาในการตั้งค่ารายการของแท็กที่ Sanitize จะใช้เป็นข้อมูลอ้างอิงสำหรับสิ่งที่มันคิดว่า "ยอมรับ" HTML
ทุกแท็กอื่น ๆ ที่ไม่ได้อยู่ในรายชื่อที่จะถูกลบออกจากข้อความแจง
Sanitize สามารถทำงานร่วมกับมาตรฐานหรือรูปแบบ HTML
ห้องสมุดสามารถตรวจจับและกรองออกแท็ก, คุณลักษณะและโปรโตคอล
ข้อความที่ทำความสะอาดจะออกมาเสมอเป็น HTML XHTML ที่ถูกต้องหรือ
เพื่อช่วยให้นักพัฒนาที่จะเริ่มต้นในโครงการของพวกเขา Sanitize มาพร้อมกับการกำหนดค่าสำเร็จรูปไม่กี่รวม ตรวจสอบไฟล์ README สำหรับรายละเอียดเพิ่มเติม
มีอะไรใหม่ ในข่าวประชาสัมพันธ์ฉบับนี้.
- เพิ่มสอง CSS ใหม่การตั้งค่าการตั้งค่า: และ at_rules_with_properties. at_rules_with_styles
- เพิ่มการสนับสนุนอย่างเต็มที่สำหรับกฎ CSS @Page ในการตั้งค่าที่ผ่อนคลายรวมถึงการสนับสนุนสำหรับทุกกฎกล่องหน้าอัตรากำไร.
- เพิ่ม CSS ต่อไปนี้ที่กฎการตั้งค่าที่ผ่อนคลาย.
- เพิ่มทั้งกลุ่มของคุณสมบัติ CSS เพื่อกำหนดค่าผ่อนคลาย ดูรายชื่อทั้งหมดที่นี่.
- การปรับปรุงประสิทธิภาพขนาดเล็ก.
- งี่เง่าที่จะอัพเกรด 1.0.2 ที่จะรับการแก้ไขที่มีผลต่อการแยกของกฎ CSS @Page.
มีอะไรใหม่ ในรุ่น 3.1.2:
- คงที่: #document #fragment และล้มเหลวในการแช่แข็ง สายและไม่ได้ตั้งใจจะปรับเปลี่ยนสาย unfrozen ถ้าพวกเขาใช้การเข้ารหัสอื่นที่ไม่ใช่ UTF-8 หรือถ้าพวกเขามีตัวละครที่ไม่ได้รับอนุญาตใน HTML.
มีอะไรใหม่ ในรุ่น 3.0.2:
- การปรับปรุง Nokogumbo 1.1.12 เพราะ 1.1 11 หวนกลับเงียบเปลี่ยนแปลงที่เรากำลังพยายามที่จะรับในรุ่นที่ผ่านมา.
มีอะไรใหม่ ในรุ่น 3.0.0:
- เพิ่มการสนับสนุนการรักษาสุขอนามัยขั้นสูงโดยใช้ CSS งี่เง่าซึ่งเป็น อย่างสอดคล้องกับ CSS ไวยากรณ์โมดูลระดับ 3 แยกสเปค เนื้อหาของ x3c อนุญาตพิเศษ & #; & # สไตล์ x3e; องค์ประกอบและรูปแบบแอตทริบิวต์ใน HTML จะได้รับการปรุงแต่งเป็น CSS, หรือคุณสามารถใช้ Sanitize :: คลาส CSS ด้วยตนเอง sanitize stylesheets CSS หรือคุณสมบัติ.
- เพิ่ม: การตั้งค่า allow_doctype เมื่อความจริงรูปแบบที่ดีนิยามประเภทเอกสารที่จะได้รับอนุญาตในเอกสาร เมื่อเท็จ (เริ่มต้น) นิยามประเภทเอกสารที่จะถูกลบออกจากเอกสาร คำจำกัดความ Doctype จะไม่ได้รับอนุญาตในชิ้นส่วนโดยไม่คำนึงถึงการตั้งค่านี้.
- เพิ่มองค์ประกอบต่อไปนี้เพื่อกำหนดค่าผ่อนคลายนอกเหนือไปจากคุณลักษณะต่างๆ:. บทความนอกเหนือร่างกายข้อมูล div ท้ายหัวส่วนหัว, HTML, หลัก nav ส่วนช่วงสไตล์ชื่อ
- : ตั้งค่า whitespace_elements คือตอนนี้แฮและช่วยให้คุณสามารถระบุข้อความที่จะแทรกก่อนและหลังองค์ประกอบเหล่านี้เมื่อพวกเขากำลังถูกลบออก แบบเก่าค่าการตั้งค่าอาร์เรย์ที่ใช้ยังคงได้รับการสนับสนุนในการทำงานร่วมกันหลัง.
- อักขระ Unicode ไม่เหมาะสมจะถูกลบออกในขณะนี้จาก HTML ก่อนที่จะแยก.
- คงที่:
- วงเล็บไม่แท็กในการป้อนข้อมูลเช่น & quot; & # 1 x3e; 2 และ 2 & # x3c; 1 & quot; มีการแยกวิเคราะห์ในขณะนี้และหนีออกมาได้อย่างถูกต้องสอดคล้องกับข้อมูลจำเพาะ HTML5 กลายเป็น & quot; 1 & gt; 2 และ 2 & lt; 1 & quot;.
- พี่น้องเพิ่มหลังจากโหนดปัจจุบันในระหว่างการสำรวจเส้นทางอยู่ในขณะนี้ยังสำรวจ ในรุ่นก่อนหน้าพวกเขาได้เพียงแค่ข้าม.
- Nokogiri ได้รับการตีและได้รับคำสั่งให้หยุดการเพิ่มบรรทัดใหม่หลังจากองค์ประกอบบางอย่างเพราะถ้าคนที่ต้องการขึ้นบรรทัดใหม่มีพวกเขาจะได้นำพวกเขามีซ.
มีอะไรใหม่ ในรุ่น 2.0.6:
- รุ่น 2.0.5 รวมโดยไม่ได้ตั้งใจทำงานในบาง การเปลี่ยนแปลง -progress ที่ไม่ควรมีการทำทางของพวกเขาเป็นสาขาต้นแบบ.
มีอะไรใหม่ ในรุ่น 1.2.1:
- เพิ่ม: การตั้งค่าการตั้งค่า remove_contents ถ้าตั้งค่าเป็นจริง Sanitize จะลบเนื้อหาขององค์ประกอบทั้งหมดที่ไม่อนุญาตพิเศษนอกเหนือไปจากองค์ประกอบของตัวเอง หากการตั้งค่าอาร์เรย์ของชื่อองค์ประกอบ Sanitize จะลบเนื้อหาขององค์ประกอบเหล่านั้นเท่านั้น (เมื่อกรอง) และออกจากเนื้อหาขององค์ประกอบอื่น ๆ ที่ผ่านการกรอง [ขอบคุณที่ราฟาเอลซูซ่าสำหรับตัวเลือกอาร์เรย์]
- เพิ่ม: การตั้งค่าการตั้งค่า output_encoding เพื่อให้การเข้ารหัสอักขระสำหรับการแสดงผล HTML ที่จะระบุ เริ่มต้นคือ 'UTF-8'.
- กัญชาสภาพแวดล้อมที่ผ่านเข้ามาในขณะนี้รวมถึงหม้อแปลง: รายการ node_name ที่มีชื่อตัวพิมพ์เล็กของโหนดปัจจุบัน HTML (เช่น & quot; div & quot;) .
- กลับสิ่งอื่นที่ไม่ใช่กัญชาหรือศูนย์จากหม้อแปลงตอนนี้จะเพิ่มความหมาย Sanitize :: ข้อยกเว้นข้อผิดพลาดมากกว่า NameError ที่ไม่ได้ตั้งใจ.
ต้องการ
- ทับทิม 1.9.2 หรือสูงกว่า
- Nokogiri 1.4.4 หรือสูงกว่า
ความคิดเห็นที่ไม่พบ