2016-07-16 65 views
0

是否有任何类似的库/包在模拟vis(3)unvis(3)为BSD系统做的事情?我试图做一些需要表示包含特殊字符(如空格等)的字符串。图书馆/包在去处理字符串编码?

+0

办[strconv.Quote(https://golang.org/pkg/strconv/#Quote)或QuoteToASCII你在找什么? – hobbs

回答

0

不,不完全是,但如果你正在寻找URL编码,你可以做你想做与net/url包中的所有URL编码:
见:Encode/decode URLs
和:Is there any example and usage of url.QueryEscape ? for golang

示例代码:

fmt.Println(url.QueryEscape("https://stackoverflow.com/questions/tagged/go test\r \r\n")) 

输出:

http%3A%2F%2Fstackoverflow.com%2Fquestions%2Ftagged%2Fgo+test%0D+%0D%0A 

或写自己:

围棋串UTF-8编码,实际上是个字节的只读片:
你可能会得到字节是这样的:

str := "UTF-8" 
bytes := []byte(str) // string to slice 
fmt.Println(str, bytes) // UTF8 [85 84 70 45 56] 

或转换字节到这样的字符串:

s := string([]byte{85, 84, 70, 45, 56, 32, 0xc2, 0xb5}) // slice to string 
fmt.Println(s)           // UTF-8 µ 

为0xC2 0xB5执行是UTF-8(十六进制)用于字符 'MICRO SIGN'(U + 00B5)见:http://www.fileformat.info/info/unicode/char/00b5/index.htm

你也可能得到的字节是这样的:

for i := 0; i < len(s); i++ { 
    fmt.Printf("%d: %d, ", i, s[i]) 
    //0: 85, 1: 84, 2: 70, 3: 45, 4: 56, 5: 32, 6: 194, 7: 181, 
} 

或紧凑十六进制格式:

fmt.Printf("% x\n", s) // 55 54 46 2d 38 20 c2 b5 

并获得符文(Unicode代码点)是这样的:

for i, v := range s { 
    fmt.Printf("%d: %v, ", i, v) 
    //0: 85, 1: 84, 2: 70, 3: 45, 4: 56, 5: 32, 6: 181, 
} 

看:What is a rune?

和转换符文字符串:符文

r := rune(181) 
fmt.Printf("%#U\n", r) // U+00B5 'µ' 
st := "this is UTF-8: " + string(r) 
fmt.Println(st) // this is UTF-8: µ 

转换切片字符串:

rs := []rune{181, 181, 181, 181} 
sr := string(rs) 
fmt.Println(sr) // µµµµ 

字符串转换为切片符文:

br := []rune(sr) 
fmt.Println(br) //[181 181 181 181] 

的%Q(报价)动词会转义字符串中的任何不可打印的字节序列,因此输出是明确的:

fmt.Printf("%+q \n", "Hello, 世界") // "Hello, \u4e16\u754c" 

unicode.IsSpace报告符文是否为由Unicode的空白空间属性定义的空格字符;在拉丁语-1空间这是

'\ t','\ n','\ v','\ f','\ r','',U + 0085(NEL),U + 00A0 (NBSP)。 示例代码:

package main 

import (
    "bytes" 
    "fmt" 
    "unicode" 
) 

func main() { 
    var buf bytes.Buffer 
    s := "\u4e16\u754c \u0020\r\n 世界" 
    for _, r := range s { 
     if unicode.IsSpace(r) { 
      buf.WriteString(fmt.Sprintf("\\u%04x", r)) 
     } else { 
      buf.WriteString(string(r)) 
     } 
    } 
    st := buf.String() 
    fmt.Println(st) 
} 

输出:

世界\u0020\u0020\u000d\u000a\u0020\u0020世界 

您可以在unicode/utf8unicodestrconvstrings包找到更多的功能:
https://golang.org/pkg/unicode/utf8/
https://golang.org/pkg/unicode/
https://golang.org/pkg/strings/
https://golang.org/pkg/strconv/

https://blog.golang.org/strings