VIETUNI [V1.618] - Nhập liệu v xử l văn bản tiếng Việt qua mạng



 M đang dng: 
 
Nếu bạn dng NS6 hoặc Mozilla hoặc một browser khc khng phải IE, bạn chỉ g được chữ Việt nếu con trỏ ở cuối bi. C thể ci ny sẽ tốt hơn: VietUni dng cho Java-TextArea.

Ch giải:

  • TELEX, VNI, VIQR: cc cch g chữ Việt thng dụng
    Kiểu Loạn: Tiện đu g đấy, TELEX, VNI hay VIQR


  • Kiểm tra chính tả và tự động sửa lại từ tiếng Anh bị lỗi : khi gõ chữ Việt theo cách TELEX các phím như [w], [s]... được coi là các phím điều khiển, một từ tiếng Anh như "cosmos" hiểu theo TELEX sẽ thành "cómó". Cách gõ lặp: "cossmoss" để viết những từ tiếng nước ngoài như vậy lại thường bị quên. Bật tính năng này VietUni sẽ tự kiểm tra lỗi chính tả tiếng Việt cơ bản để khẳng định từ đang được đưa vào có phải từ Việt không, nếu vi phạm như "cómó" (không có trong tiếng Việt) thì nó sẽ tự sửa lại thành "cosmos" như nguyên gốc.


  • M đang dng: kĩ thuật số khng hiểu cc chữ ci như chng ta hiểu, mỗi chữ ci được xử l thng qua một con số nhất định. Bảng m l một bảng qui định tương ứng giữa cc chữ ci của một ngn ngữ với cc số. Biết được bảng m (qui định) no đang được dng l một điều kiện cần để xử l văn bản một cch c nghĩa.


  • [Đổi sang]: đổi sang dng một bảng m khc cho văn bản để ph hợp với yu cầu v mi trường xử l cụ thể: chọn bảng m cần dng ở chọn bn phải v nhấn [Đổi sang] (Nếu copy từ nơi khc về th trước tin nhấn [Nhận dạng m]).


  • [Nhận dạng m]: Nếu bạn copy từ đu đ trong mạng một văn bản Việt m khng đọc được v khng r n dng bảng m no th nhấn nt ny, VietUni sẽ phn tch v nhận dạng gip bạn. Bộ g sau đ sẽ cho php bạn nhập liệu trực tiếp bổ xung vo văn bản dng cng bảng m đ.


  • [To UNICODE]: Nt chuyển đổi nhanh: bất kể bi được copy về thuộc dạng no, VietUni tự động nhận dạng m của bi viết v chuyển lun sang dạng dng UNICODE.


  • [Preview]: Nếu bạn soạn thảo văn bản HTML hoặc c dng HTML để định dạng th c thể nhấn nt ny để xem thử trước kết quả.


  • [Nhớ vo file]: Ghi bi viết vo đĩa cứng. Nếu văn bản của bạn dng unicode, nhớ chuyển thnh dạng UTF-8 hoặc &#Unicode; trước khi nhớ vo file, nếu khng VietUni sẽ dng 16bit-unicode, hiện tại dạng file ny cn nhiều vấn đề, chưa nn dng.


  • [Sot dấu]: Nếu bạn qun chưa bật bộ g chữ Việt m đ đnh gần xong bi rồi mới nhận ra (nhiều người sợ hại mắt nn hay nhn bn phm chứ khng nhn mn hnh khi g) th bạn cũng khng cần xo đi viết lại, chỉ cần chọn kiểu g bạn đ dng rồi nhấn sot dấu v tất cả lại ổn thoả.


  • [Sửa lại dấu]: Khi unicode chưa phổ biến, kiểu viết chữ Việt đại khi: VIQR rất thng dụng trn mạng. Nguyn gốc VIQR dng bộ m 7bit để diễn đạt chữ quốc ngữ, nhiều người tiếp tục pht huy tnh tự do v sng tạo của n v "8bit-VIQR" ra đời, một kiểu chữ Việt "quan trọng l hiểu được" nữa. Khi chuyển những bi viết theo lối ny sang unicode cc converter thường gặp vấn đề, kết quả c thể như sau:
        Lay l(t ... l(t lay n(ng bỏ v` cu ch.ơ
        Qang qa(ng chi cu nh.ac đi hoang
        - Thơ Jazzygirl - :-)
    Nhấn nt [Sửa lại dấu] để c bản tiếng Việt hon chỉnh hơn sau khi chuyển đổi.


  • [Chnh tả]: Lỗi chnh tả trong tiếng Việt rất c tnh hệ thống, lin quan đến đặc điểm pht m của từng vng, chẳng hạn người bắc hay nhầm giữa 'tr' v 'ch', 'x' v 's', 'd' v 'gi' v 'r'; người nam đnh dấu '?' v '~' sai, 'n' v 'ng' hay 'c' v 't' ở cuối từ .v.v. Nhấn nt ny để sot lại bi v sửa những lỗi hay mắc phải kiểu như vậy. Đy l một cng cụ c khả năng (v cn chờ) tiến bộ trong tương lai (kho dữ liệu về cc lỗi cn rất nhỏ).


  • [Tm & sửa]: một lạm dụng của cng cụ [Chinhs tả], bạn c thể tm một từ nhất định v thay thế n bằng một từ mới trong ton bộ văn bản.


  • [Xo]: Xo bi v phục hồi trạng thi mặc định của khung cng cụ (reset form).





Xin chn thnh cảm ơn cc bạn đ quan tm cho nhận xt, gp cũng như tham gia trực tiếp vo việc sửa lỗi, nng cấp bộ g chữ Việt cho web ny, đặc biệt l anh CảNgố, Anh Đức, IAMINLOVE, HaiNam, Quốc Anh, Dixon u, Chn Rm...

kiến v thắc mắc xin gửi cho tc giả: tuan.tran@avys.de
Cảm ơn sự cộng tc của cc bạn!




[Trang chủ AVYS]     [Ứng dụng mẫu]     [Hướng dẫn cch g]