判断中文字符长度的函数代码,的简单实现
分类:关于美高梅

在java中一个hashCode算法,可以用来计算一个字符串的hash值,今天一个朋友突然问俺能不能在js中计算hashCode,要求和java的hashCode计算结果一样。

javascript中实现兼容JAVA的hashCode算法代码分享,javascripthashcode

在java中一个hashCode算法,可以用来计算一个字符串的hash值,今天一个朋友突然问俺能不能在js中计算hashCode,要求和java的hashCode计算结果一样。

对于java的hashCode,以前到现在也一直没有了解过其算法,不过猜想应该也不会太难,于是现在java中写了这段代码进行测试:
运行结果:899755

按下Ctrl键点击hashCode方法名跟进去看了下其算法,发现是很简单的几句代码,如下所示:

复制代码 代码如下:

public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;

for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}

这下好,简单移植过去到js里就应该ok了。于是写出如下JS代码:

复制代码 代码如下:

<script type="text/javascript">
function hashCode(str){
         var h = 0, off = 0;
         var len = str.length;
         for(var i = 0; i < len; i++){
             h = 31 * h + str.charCodeAt(off++);
         }
         return h;
     }
     alert(hashCode('沈阳'));
   </script>

运行结果:899755

OK,与java计算结果一样。本以为这么就搞定了,然后想着再随便找个串测试下:

“沈阳沈阳啊”,在JAVA中运行结果为:1062711668,然而到js中成了:26832515444。

狂晕,这随便一试就有问题了!后思考片刻,突然想到Java中int长度好像是21亿左右,js中就没这限制了。问题应该就是在这里了,于是对之前的方法做了一点改造:

复制代码 代码如下:

<script>
function hashCode(str){
         var h = 0, off = 0;
         var len = str.length;
         for(var i = 0; i < len; i++){
             h = 31 * h + str.charCodeAt(off++);
         }
     var t=-2147483648*2;
     while(h>2147483647){
       h+=t
     }
         return h;
     }
alert(hashCode('沈阳沈阳啊'));</script>

再次测试!OK!大功告成。没有什么技术含量,一点小总结
2013-02-19更新,上面那个效率比较低下,当内容很长的时候会当掉,下面的代码是优化后的代码:

复制代码 代码如下:

<script>
    function hashCode(str) {
        var h = 0;
        var len = str.length;
        var t = 2147483648;
        for (var i = 0; i < len; i++) {
            h = 31 * h + str.charCodeAt(i);
            if(h > 2147483647) h %= t;//java int溢出则取模
        }
        /*var t = -2147483648 * 2;
        while (h > 2147483647) {
            h += t
        }*/
        return h;
    }
    alert(hashCode('C#同一时间N个线程在并发执行,其余在队列中如何实现')); //1107373715
</script>

首先简单的介绍关于属性的一些方法:
属性的枚举:
for/in循环是遍历对象属性的方法。如

JS的字符串都是string对象,可以用string对象的length属性可以获取其长度,但是无论是中文、全角符号以及英文最小长度单位都是1,这与php的strlen()并不相同。

对于java的hashCode,以前到现在也一直没有了解过其算法,不过猜想应该也不会太难,于是现在java中写了这段代码进行测试:
运行结果:899755

问一个java中对于hashcode的问题

嗨这个问题是这样的!
(hash code)我们称为哈希嘛,或叫散列码、是由对象导出的一个整型值。理论上将它是没有规律的。不同的对象应该具有不同的hashcode。
标准的String库中String类获取散列码的算法如下:
int hash = 0;
for(int i=0;i<length();i++) hash = 31 * hash + charAt(i);
由此可见String类型的s1和s2的散列码是根据内容导出的,因为它们有相同的内容,所以散列码相同。

详细的请参看java库源代码或《java技术核心技术卷1》5.2.3 祝愿对您有所帮助  

复制代码 代码如下:

复制代码 代码如下:

按下Ctrl键点击hashCode方法名跟进去看了下其算法,发现是很简单的几句代码,如下所示:

Java中的HashCode问题

1.不同的字符串可能会有相同的HashCode吗?
可以!

2.相同的字符串可能会有不同的HashCode吗?
如果你自己重写equals和hashcode方法是可以实现的,但是java规范要求两个equals的对象一定要有相同的hashcode

3.相同的字符串每次生成的HashCode都相同吗?
你的实现可以不同,但是java规范要求对于同一个对象每次生成的hashcode必须相同!

具体可参照API的Object中的equals方法和hashCode方法  

在java中一个hashCode算法,可以用来计算一个字符串的hash值,今天一个朋友突然...

var obj = {
name : 'obj1',
age : 20,
height : '176cm'
}
var str = '';
for(var name in obj)
{
str += name + ':' + obj[name] + 'n';
}
alert(str);

function strlen(str) {
var s = 0;
for(var i = 0; i < str.length; i++) {
if(str.charAt(i).match(/[u0391-uFFE5]/)) {
s += 2;
} else {
s++;
}
}
return s;
}

复制代码 代码如下:

输出为:name:obj1
  age:20
  height:176cm
检查属性是否存在:
in运算符可以用来测试一个属性是否存在。

抓取出每个字符,匹配全角字符和汉字的,则计2个字符,其他的则计1个字符。

public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;

复制代码 代码如下:

复制代码 代码如下:

for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}

this.containsKey = function ( key )
{
return (key in entry);
}

<script>
alert (fucCheckLength("中国a"));
function fucCheckLength(strTemp)
{
var i,sum;
sum=0;
for(i=0;i<strTemp.length;i++)
{
if ((strTemp.charCodeAt(i)>=0) && (strTemp.charCodeAt(i)<=255))
sum=sum+1;
else
sum=sum+2;
}
return sum;
}
</script>

这下好,简单移植过去到js里就应该ok了。于是写出如下JS代码:

删除属性
使用delete运算符来删除一个对象的属性。使用delete删除的属性,for/in将不会枚举该属性,并且in运算符也不会检测到该属性。
delete entry[key];
delete obj.name;
下面是哈希表(hashtable)的js的实现方法:

会得到结果是:5 要得到的字节长度吧?请注意字节和字符的差异。而字节长度是和编码有关系的,比如"中国a",gbk/gb2312编码是5个字节,可是如果是utf-8,则是7个字节(utf-8下通常一个汉字3个字节)。
我们可以把所有字符转换在gbk再操作,实例

复制代码 代码如下:

复制代码 代码如下:

复制代码 代码如下:

<script type="text/javascript">
function hashCode(str){
         var h = 0, off = 0;
         var len = str.length;
         for(var i = 0; i < len; i++){
             h = 31 * h + str.charCodeAt(off++);
         }
         return h;
     }
     alert(hashCode('沈阳'));
   </script>

function HashTable()
{
var size = 0;
var entry = new Object();
this.add = function (key , value)
{
if(!this.containsKey(key))
{
size ++ ;
}
entry[key] = value;
}
this.getValue = function (key)
{
return this.containsKey(key) ? entry[key] : null;
}
this.remove = function ( key )
{
if( this.containsKey(key) && ( delete entry[key] ) )
{
size --;
}
}
this.containsKey = function ( key )
{
return (key in entry);
}
this.containsValue = function ( value )
{
for(var prop in entry)
{
if(entry[prop] == value)
{
return true;
}
}
return false;
}
this.getValues = function ()
{
var values = new Array();
for(var prop in entry)
{
values.push(entry[prop]);
}
return values;
}
this.getKeys = function ()
{
var keys = new Array();
for(var prop in entry)
{
keys.push(prop);
}
return keys;
}
this.getSize = function ()
{
return size;
}
this.clear = function ()
{
size = 0;
entry = new Object();
}
}

function Utf8ToUnicode(strUtf8)
{
var bstr = "";
var nTotalChars = strUtf8.length; // total chars to be processed.
var nOffset = 0; // processing point on strUtf8
var nRemainingBytes = nTotalChars; // how many bytes left to be converted
var nOutputPosition = 0;
var iCode, iCode1, iCode2; // the value of the unicode.
while (nOffset < nTotalChars)
{
iCode = strUtf8.charCodeAt(nOffset);
if ((iCode & 0x80) == 0) // 1 byte.
{
if ( nRemainingBytes < 1 ) // not enough data
break;
bstr += String.fromCharCode(iCode & 0x7F);
nOffset ++;
nRemainingBytes -= 1;
}
else if ((iCode & 0xE0) == 0xC0) // 2 bytes
{
iCode1 = strUtf8.charCodeAt(nOffset + 1);
if ( nRemainingBytes < 2 || // not enough data
(iCode1 & 0xC0) != 0x80 ) // invalid pattern
{
break;
}
bstr += String.fromCharCode(((iCode & 0x3F) << 6) | ( iCode1 & 0x3F));
nOffset += 2;
nRemainingBytes -= 2;
}
else if ((iCode & 0xF0) == 0xE0) // 3 bytes
{
iCode1 = strUtf8.charCodeAt(nOffset + 1);
iCode2 = strUtf8.charCodeAt(nOffset + 2);
if ( nRemainingBytes < 3 || // not enough data
(iCode1 & 0xC0) != 0x80 || // invalid pattern
(iCode2 & 0xC0) != 0x80 )
{
break;
}
bstr += String.fromCharCode(((iCode & 0x0F) << 12) |
((iCode1 & 0x3F) << 6) |
(iCode2 & 0x3F));
nOffset += 3;
nRemainingBytes -= 3;
}
else // 4 or more bytes -- unsupported
break;
}
if (nRemainingBytes != 0)
{
// bad UTF8 string.
return "";
}
return bstr;
}

运行结果:899755

测试:
代码

如何解决这个问题.本文介绍使用js来获取中文字长度方法

OK,与java计算结果一样。本以为这么就搞定了,然后想着再随便找个串测试下:

复制代码 代码如下:

首先,我们定义一个新的函数getBytes()取得字符串的字节数,在javascript里,这个函数是标准函数。

“沈阳沈阳啊”,在JAVA中运行结果为:1062711668,然而到js中成了:26832515444。

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ";
<html xmlns=";
<head>
<title>HashTable</title>
<script type="text/javascript" src="/js/jquery.js"></script>
<script type="text/javascript" src="/js/HashTable.js"></script>
<script type="text/javascript">
function MyObject(name)
{
this.name = name;
this.toString = function(){
return this.name;
}
}
$(function(){
var map = new HashTable();
map.add("A","1");
map.add("B","2");
map.add("A","5");
map.add("C","3");
map.add("A","4");
var arrayKey = new Array("1","2","3","4");
var arrayValue = new Array("A","B","C","D");
map.add(arrayKey,arrayValue);
var value = map.getValue(arrayKey);
var object1 = new MyObject("小4");
var object2 = new MyObject("小5");
map.add(object1,"小4");
map.add(object2,"小5");
$('#console').html(map.getKeys().join('|') + '<br>');
})
</script>
</head>
<body>
<div id="console"></div>
</body>
</html>

复制代码 代码如下:

狂晕,这随便一试就有问题了!后思考片刻,突然想到Java中int长度好像是21亿左右,js中就没这限制了。问题应该就是在这里了,于是对之前的方法做了一点改造:

javascript hashtable实现代码
//www.jb51.net/article/20372.htm

  String.prototype.getBytes = function() {
  var cArr = this.match(/[^x00-xff]/ig);
  return this.length + (cArr == null ? 0 : cArr.length);
  }
  function paramCheck(cur){
  if(cur.value.getBytes() > 64){
  alert("字符超过64个字符");
  return false;
  }
  return true;
  }

复制代码 代码如下:

您可能感兴趣的文章:

  • js中哈希表的几种用法总结
  • JavaScript中实现键值对应的字典与哈希表结构的示例
  • js实现HashTable(哈希表)的实例分析
  • javascript实现获取字符串hash值
  • 浅谈js多维数组和hash数组定义和使用
  • javascript hashtable实现代码
  • js数组去重的hash方法
  • js模拟hashtable的简单实例
  • js实现hashtable的赋值、取值、遍历操作实例详解
  • JS模拟实现哈希表及应用详解

  getBytes用正则表达式来判断字符串中包含汉字的个数,包含的汉字都放到数组cArr中,这样cArr的长度就是汉字的总数。getBytes方法返回length加上汉字数,就是总的字节数。
  只是使用了[^x00-xff],这个有点恶心,有些特殊字符也是能匹配到的,比如}等。
  但是如果使用[^u4E00-u9FA5]的话,却不能匹配到中文……

<script>
function hashCode(str){
         var h = 0, off = 0;
         var len = str.length;
         for(var i = 0; i < len; i++){
             h = 31 * h + str.charCodeAt(off++);
         }
     var t=-2147483648*2;
     while(h>2147483647){
       h+=t
     }
         return h;
     }
alert(hashCode('沈阳沈阳啊'));</script>

以下是另外几种方法,大家可以测试下: 一种:

再次测试!OK!大功告成。没有什么技术含量,一点小总结
2013-02-19更新,上面那个效率比较低下,当内容很长的时候会当掉,下面的代码是优化后的代码:

复制代码 代码如下:

复制代码 代码如下:

function _length(str){
var len=0;
for(var i=0;i<str.length;i++){
if(str.charAt(i)>'~'){len+=2;}else{len++;}
}
return len;
}

<script>
    function hashCode(str) {
        var h = 0;
        var len = str.length;
        var t = 2147483648;
        for (var i = 0; i < len; i++) {
            h = 31 * h + str.charCodeAt(i);
            if(h > 2147483647) h %= t;//java int溢出则取模
        }
        /*var t = -2147483648 * 2;
        while (h > 2147483647) {
            h += t
        }*/
        return h;
    }
    alert(hashCode('C#同一时间N个线程在并发执行,其余在队列中如何实现')); //1107373715
</script>

二种:

您可能感兴趣的文章:

  • js实现HashTable(哈希表)的实例分析
  • js模拟hashtable的简单实例
  • javascript hashtable 修正版 下载
  • js 模拟实现类似c#下的hashtable的简单功能代码
  • javascript 哈希表(hashtable)的简单实现
  • javascript hashtable实现代码
  • JAVASCRIPT HashTable
  • js数组去重的hash方法
  • 浅谈js多维数组和hash数组定义和使用
  • javascript实现获取字符串hash值
  • javascript实现的HashMap类代码
  • js实现hashtable的赋值、取值、遍历操作实例详解

复制代码 代码如下:

String.prototype.gblen = function() {
var len = 0;
for (var i=0; i<this.length; i++) {
if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {
len += 2;
} else {
len ++;
}
}
return len;
}
String.prototype.gbtrim = function(len, s) {
var str = '';
var sp = s || '';
var len2 = 0;
for (var i=0; i<this.length; i++) {
if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {
len2 += 2;
} else {
len2 ++;
}
}
if (len2 <= len) {
return this;
}
len2 = 0;
len = (len > sp.length) ? len-sp.length: len;
for (var i=0; i<this.length; i++) {
if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {
len2 += 2;
} else {
len2 ++;
}
if (len2 > len) {
str += sp;
break;
}
str += this.charAt(i);
}
return str;
}
var str1 = '世上最牛的@#%&们 世上最牛的@#%&们';
document.write('str1 = '+ str1 +'
');
document.write('length = '+ str1.gblen() +'
');
document.write('gbtrim(10) = '+ str1.gbtrim(10) +'
');
document.write('gbtrim(10, '…') = '+ str1.gbtrim(10, '…') +'
');
document.write('gbtrim(12, '-' ) = '+ str1.gbtrim(12, '-') +'
');

// gbtrim(len 截取长度,按英文字节长度计算, s截取后的省略字符,如"…" )
// 备注: 这里中文字符都是当作两个长度来计算的,所以gbtrim中的len为10时,是显示最多5个汉字的。
// 当汉字数大于5时,由于截取后加上“…”,所以只显示4个汉字。

您可能感兴趣的文章:

  • js判断字符长度及中英文数字等
  • js判断字符长度以及中英文数字等
  • JavaScript判断字符长度、数字、Email、电话等常用判断函数分享
  • js关于字符长度限制的问题示例探讨
  • JS按字节截取字符长度实例
  • 限制textbox或textarea输入字符长度的JS代码
  • CSS(js)限制页面显示的文本字符长度
  • js实现正则匹配中文标点符号的方法
  • js中判断数字字母中文的正则表达式 (实例)
  • 中文用户名的js检验正则
  • javascript判断中文的正则
  • JavaScript中英文字符长度统计方法示例【按照中文占2个字符】

本文由美高梅网址发布于关于美高梅,转载请注明出处:判断中文字符长度的函数代码,的简单实现

上一篇:JavaScript如何动态创建table表格,DOM操作之动态删 下一篇:没有了
猜你喜欢
热门排行
精彩图文