使用go实现删除sql里面的注释和字符串功能(demo)

(编辑:jimmy 日期: 2024/12/24 浏览:2)

项目里面有一个需求,要对sql进行简单的语法分析

为了避免sql里面的字符串和注释对语法分析做干扰,我写了一个java函数,对sql进行修剪,删除里面字符串和注释,用空格代替
周末闲着没事,我用go重新实现了这个功能,感觉应该会有后来人可以用上

说明:
sql里面的注释有两种单行注释和多行注释,其中单行注释以--开头,以\n结尾,多行注释以/开头,以/结尾
sql字符串是以'开头,'结尾,但特别的地方是连续两个单引号是代表一个单引号而不是字符串结束标志

关键函数如下:

`
/**

将字节数组里面注释和字符串,用空格替换 rangeBeg和rangeEnd是数组元素起始位置 左闭右开
*/
func TrimSqlByteArray(sql []byte, rangeBeg int, rangeEnd int) []byte {
sqlLength := rangeEnd - rangeBeg - 1;
//删除注释或者字符串后 用空格填充 必免因删除导致粘连改变sql语义
const chPad = ' '

//结果切片,预分配空间为入参sql长度一半
result := make([] byte, 0, sqlLength / 2)

//本字符类型
var charType int = NORMAL;
for i := rangeBeg; i < rangeEnd; i++ {
/*
*utf8编码不影响判断
//跳过非英文字符
if sql[i] & 0x80 != 0 {
//utf8编码:UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;
//如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。
//UTF-8最多可用到6个字节。 这里不考虑异常,因为go的字符串基本都是标准utf8编码
i += getPreNotZeroCount(sql[i]) - 1
continue;
}
*/
 //本字符类型 预设为普通字符
 charType = NORMAL
 ch := sql[i]

 //下一个字符
 var chNext byte;
 chNext = getCharSafe(sql, rangeEnd, i + 1)

 //非有效sql内容结束位置
 endPos := 0

 if ch == '-' && chNext == '-' {
 	//单行注释
 	charType = LINE
 	//下标移到非有效字符的最后
 	endPos = seekToNext(sql, i + 2, rangeEnd, charType)
 } else if ch == '/' && chNext == '*' {
 	//多行注释
 	charType = MULTI
 	//下标移到非有效字符的最后
 	endPos = seekToNext(sql, i + 2, rangeEnd, charType)
 } else if ch == '\'' {
 	//字符串
 	charType = STRING
 	//下标移到非有效字符的最后
 	endPos = seekToNext(sql, i + 1, rangeEnd, charType)
 }

 //如果字符是非有效字符 则用空格代替 否则保持原样
 if charType == NORMAL {
 	result = append(result, ch)
 } else {
 	result = append(result, chPad)
 	i = endPos - 1
 }
}

return result;
}

/**

获取字符串或者注释的右边界位置(不包含)

rangeEnd是数组边界
*/
func seekToNext(sql []byte, begPos int, rangeEnd int, charType int) int {

result := begPos;

switch charType {
case MULTI:
for ; result < rangeEnd; result++ {
ch := sql[result]
chNext := getCharSafe(sql, rangeEnd, result+ 1)
if ch == '*' && chNext == '/' {
 		result = result + 1;
 		break;
 	}
 }

 break
case LINE:
for ; result < rangeEnd; result++ {
ch := sql[result]
if ch == '\n' {
 		break;
 	}
 }

 break
case STRING:
for ; result < rangeEnd; result++ {
ch := sql[result]
chNext := getCharSafe(sql, rangeEnd, result + 1)
//sql字符串里面连续的单引号被认为是' 则不是字符串结束标志
 	if ch == '\'' && chNext == '\'' {
 		result = result + 1;
 		continue;
 	} else if ch == '\'' {
 		break;
 	}
 }

 break
default:
break;
}

result++;

return result;
}

完整代码及单元测试已上传 https://github.com/kingstarer/kingstarer.git

一句话新闻

一文看懂荣耀MagicBook Pro 16
荣耀猎人回归!七大亮点看懂不只是轻薄本,更是游戏本的MagicBook Pro 16.
人们对于笔记本电脑有一个固有印象:要么轻薄但性能一般,要么性能强劲但笨重臃肿。然而,今年荣耀新推出的MagicBook Pro 16刷新了人们的认知——发布会上,荣耀宣布猎人游戏本正式回归,称其继承了荣耀 HUNTER 基因,并自信地为其打出“轻薄本,更是游戏本”的口号。
众所周知,寻求轻薄本的用户普遍更看重便携性、外观造型、静谧性和打字办公等用机体验,而寻求游戏本的用户则普遍更看重硬件配置、性能释放等硬核指标。把两个看似难以相干的产品融合到一起,我们不禁对它产生了强烈的好奇:作为代表荣耀猎人游戏本的跨界新物种,它究竟做了哪些平衡以兼顾不同人群的各类需求呢?