目次
前言
两个数的最值
交换两个数
向量vector
string 类实现
IsAlpha
IsSpace
字符串trim
切割字符串
正则匹配
日志系统
变参的实现
二进制1的个数
整数二进制的位数
模板 堆排序
快速排序
二分查找
数组去重
ホームページ データベース mysql チュートリアル sphinx 源码阅读之数据结构与算法

sphinx 源码阅读之数据结构与算法

Jun 07, 2016 pm 04:41 PM
sphinx 序文 データ構造 ソースコード アルゴリズム 読む

前言 源码在 sphinx 官网上就可以下载到. 起初我下载的是最新版本,结果由于代码大约有 10W 行,我看了快 1W 行后发现这样看也不是个办法。 于是我想着生成一个项目关系图来阅读代码,但是我这电脑只有windows, 网上介绍的大多都是 linux 上的,于是我只好取

cover

前言

源码在 sphinx 官网上就可以下载到.
起初我下载的是最新版本,结果由于代码大约有 10W 行,我看了快 1W 行后发现这样看也不是个办法。
于是我想着生成一个项目关系图来阅读代码,但是我这电脑只有windows, 网上介绍的大多都是 linux 上的,于是我只好取消这个念头。
后来,我想我看sphinx源码主要是先弄明白 sphinx 的工作原理,而工作原理应该一直都是保持不变的,于是我就去下载第一个版本。
第一个版本果然给力,只有 1W 行,于是我就开始高高兴兴的开始从 main 函数开始看源代码了。
看了不就发现 sphinx 用了很多数据结构,而且是自己等装好的,还是先把这些数据结构弄明白了比较好。
于是就有了这篇文章。
为了方便读者阅读,这些数据结构和算法就从简单的慢慢罗列出来。

大家可以看右面的目录,然后去看自己感兴趣的数据结构或算法对应的小节。
如果对那个小节有疑问,可以随时留言。

两个数的最值

sphinx 把最值封装成了一个宏。

#define Min(a,b)            ((a)<(b)?(a):(b))
#define Max(a,b)            ((a)>(b)?(a):(b))
ログイン後にコピー

交换两个数

为了这个通用,使用了基本的模板函数。
而交换则使用第三个缓存变量来实现这个功能。

template<typename T> 
inline void Swap(T & v1, T & v2) {
    T temp = v1;
    v1 = v2;
    v2 = temp;
}
ログイン後にコピー

向量vector

这个 vector 实现的功能很简单,基本的 insert,remove,get, set 等操作。
只是附加了一个排序功能。
具体实现方式这里就不多说了,这些都是一个类基本的操作,都很容易实现(需要谁需要这个vector的实现讲解,可以留言)。

template<typename T, int INITIAL_LIMIT = 1024> 
class CSphVector {
    public:
        CSphVector(); //初始化向量
        ~CSphVector(); //回收向量
        T & Add(); //增加一个元素,返回这个元素的引用
        void Add(const T & tValue);//增加一个元素
        T & Last();//得到最后一个元素
        void Remove(int iIndex);//删除指定位置的元素
        void Grow(int iNewLimit);//扩大缓存的大小,两倍两倍的增长
        void Resize(int iNewLength);// 原先设置数组的大小
        void Reset();// 重置数组
        int GetLength();//得到数组的长度
        void Sort(int iStart = 0, int iEnd = -1);// 正常排序
        void RSort(int iStart = 0, int iEnd = -1);// 逆序
        const T & operator [](int iIndex) const;// 读指定位置的值
        T & operator [](int iIndex);// 设置指定位置的值
    private:
        int m_iLength;//数组大小
        int m_iLimit;//数组缓存大小
        T * m_pData;//数组
};
ログイン後にコピー

string 类实现

这次 sphinx 自己实现的 string 类的功能就比较多了。
这里我罗列出一些比较简单的功能。

struct CSphString{
    CSphString (); //构造
    CSphString ( const char * sString );
    CSphString ( const CSphString & rhs ); 
    CSphString ( const char * sValue, int iLen );
    ~CSphString (); //析构
    const char * cstr () const; //得到字符串
    const char * scstr() const;//得到字符串,默认未空串
    inline bool operator == ( const char * t ) const; //判断两个串是否相等
    inline bool operator == ( const CSphString & t ) const;
    inline bool operator != ( const CSphString & t ) const;
    bool operator != ( const char * t ) const;
    const CSphString & operator = ( const CSphString & rhs );
    CSphString SubString ( int iStart, int iCount ) const;
    bool IsEmpty () const;
    CSphString & ToLower ();
    CSphString & ToUpper ();
    int Length () const;
    bool operator < ( const CSphString & b );
};
ログイン後にコピー

IsAlpha

判断一个字符是不是自己想要的字符。

inline int sphIsAlpha ( int c ){
    return ( c>='0' && c<='9' ) || ( c>='a' && c<='z' ) || ( c>='A' && c<='Z' ) || c=='-' || c=='_';
}
ログイン後にコピー

IsSpace

判断一个字符是不是空白

inline bool sphIsSpace ( int iCode ){
    return iCode==' ' || iCode=='\t' || iCode=='\n' || iCode=='\r';
}
ログイン後にコピー

字符串trim

字符串 trim 这个功能很常用,取出前边和后边的空白。

static char * ltrim ( char * sLine ){
    while ( *sLine && isspace(*sLine) )
        sLine++;
    return sLine;
}
static char * rtrim ( char * sLine ){
    char * p = sLine + strlen(sLine) - 1;
    while ( p>=sLine && isspace(*p) )
        p--;
    p[1] = '\0';
    return sLine;
}
static char * trim ( char * sLine ){
    return ltrim ( rtrim ( sLine ) );
}
ログイン後にコピー

切割字符串

切割字符串也是很常用的函数。
一般需要指定分隔符,默认分隔符是空白。
具体的实现代码这里就不展示了。

void sphSplit ( CSphVector<CSphString> & dOut, const char * sIn, const char * sBounds ){
    if ( !sIn )return;
    const char * p = (char*)sIn;
    while ( *p ){
        // skip until the first non-boundary character
        const char * sNext = p;
        while ( *p && !strchr ( sBounds, *p ) )p++;
        // add the token, skip the char
        dOut.Add().SetBinary ( sNext, p-sNext );
        p++;
    }
}
ログイン後にコピー

正则匹配

正则表达式大家都用过吧,这次 sphinx 实现了一个简单的正则表达式检验函数。
主要用于检验一个字符串是否符合指定的格式。

bool sphWildcardMatch ( const char * sString, const char * sPattern ){
    if ( !sString || !sPattern )return false;
    const char * s = sString;
    const char * p = sPattern;
    while ( *s ){
        switch ( *p ){
        case '\\':
            // escaped char, strict match the next one literally
            p++;
            if ( *s++!=*p++ )return false;
            break;
        case '?':
            // match any character
            s++;
            p++;
            break;
        case '%':
            // gotta match either 0 or 1 characters
            // well, lets look ahead and see what we need to match next
            p++;
            // just a shortcut, %* can be folded to just *
            if ( *p=='*' )break;
            // plain char after a hash? check the non-ambiguous cases
            if ( !sphIsWild(*p) ){
                if ( s[0]!=*p ){
                    // hash does not match 0 chars
                    // check if we can match 1 char, or it's a no-match
                    if ( s[1]!=*p )return false;
                    s++;
                    break;
                } else{
                    // hash matches 0 chars
                    // check if we could ambiguously match 1 char too, though
                    if ( s[1]!=*p )break;
                    // well, fall through to "scan both options" route
                }
            }
            // could not decide yet
            // so just recurse both options
            if ( sphWildcardMatch ( s, p ) )return true;
            if ( sphWildcardMatch ( s+1, p ) )return true;
            return false;
        case '*':
            // skip all the extra stars and question marks
            for ( p++; *p=='*' || *p=='?'; p++ )
                if ( *p=='?' ){
                    s++;
                    if ( !*s )return p[1]=='\0';
                }
                // short-circuit trailing star
                if ( !*p )return true;
                // so our wildcard expects a real character
                // scan forward for its occurrences and recurse
                for ( ;; ){
                    if ( !*s )return false;
                    if ( *s==*p && sphWildcardMatch ( s+1, p+1 ) )return true;
                    s++;
                }
                break;
        default:
            // default case, strict match
            if ( *s++!=*p++ )return false;
            break;
        }
    }
    // string done
    // pattern should be either done too, or a trailing star, or a trailing hash
    return p[0]=='\0'|| ( p[0]=='*' && p[1]=='\0' )|| ( p[0]=='%' && p[1]=='\0' );
}
ログイン後にコピー

日志系统

做项目的时候经常会遇到一些打日志的库,其实这个功能很简单。
基本原理都是使用和 printf 类似的方法: 变参。

static void StdoutLogger ( ESphLogLevel eLevel, const char * sFmt, va_list ap ){
    switch ( eLevel ){
        case SPH_LOG_FATAL: fprintf ( stdout, "FATAL: " ); break;
        case SPH_LOG_WARNING: fprintf ( stdout, "WARNING: " ); break;
        case SPH_LOG_INFO: fprintf ( stdout, "WARNING: " ); break;
        case SPH_LOG_DEBUG:  fprintf ( stdout, "DEBUG: " ); break;
    }
    vfprintf ( stdout, sFmt, ap );
    fprintf ( stdout, "\n" );
}
static SphLogger_fn g_pLogger = &StdoutLogger;
inline void Log ( ESphLogLevel eLevel, const char * sFmt, va_list ap ){
    if ( !g_pLogger ) return;
    ( *g_pLogger ) ( eLevel, sFmt, ap );
}
void sphWarning ( const char * sFmt, ... ){
    va_list ap;
    va_start ( ap, sFmt );
    Log ( SPH_LOG_WARNING, sFmt, ap );
    va_end ( ap );
}
void sphInfo ( const char * sFmt, ... );
void sphLogFatal ( const char * sFmt, ... );
void sphLogDebug ( const char * sFmt, ... );
ログイン後にコピー

变参的实现

上面的日志系统,最后还是调用了 vfprintf 函数, 没有让我们看到变参到底怎么实现的。
但是 sphinx 自己实现了一个 sphVSprintf 函数,和 vfprintf 类似,我不明白那个日志系统为什么不用自己的这个输出函数。
由于是对字符串分析,可以理解为一个简单的自动机。
遇到什么字符,期望下个字符是什么。
这里就不多说这个自动机了。

static int sphVSprintf ( char * pOutput, const char * sFmt, va_list ap ){
    enum eStates { SNORMAL, SPERCENT, SHAVEFILL, SINWIDTH, SINPREC };
    eStates state = SNORMAL;
    int iPrec = 0;
    int iWidth = 0;
    char cFill = ' ';
    const char * pBegin = pOutput;
    bool bHeadingSpace = true;
    char c;
    while ( ( c = *sFmt++ )!=0 ){
        // handle percent
        if ( c=='%' ){
            if ( state==SNORMAL ){
                state = SPERCENT;
                iPrec = 0;
                iWidth = 0;
                cFill = ' ';
            } else{
                state = SNORMAL;
                *pOutput++ = c;
            }
            continue;
        }
        // handle regular chars
        if ( state==SNORMAL ){
            *pOutput++ = c;
            continue;
        }
        // handle modifiers
        switch ( c ){
            case '0':
                if ( state==SPERCENT ){
                    cFill = '0';
                    state = SHAVEFILL;
                    break;
                }
            case '1': case '2': case '3':
            case '4': case '5': case '6':
            case '7': case '8': case '9':
                if ( state==SPERCENT || state==SHAVEFILL )
                {
                    state = SINWIDTH;
                    iWidth = c - '0';
                } else if ( state==SINWIDTH )
                    iWidth = iWidth * 10 + c - '0';
                else if ( state==SINPREC )
                    iPrec = iPrec * 10 + c - '0';
                break;
            case '-':
                if ( state==SPERCENT )
                    bHeadingSpace = false;
                else
                    state = SNORMAL; // FIXME? means that bad/unhandled syntax with dash will be just ignored
                break;
            case '.':
                state = SINPREC;
                iPrec = 0;
                break;
            case 's': // string
                {
                    const char * pValue = va_arg ( ap, const char * );
                    if ( !pValue )
                        pValue = "(null)";
                    int iValue = strlen ( pValue );
                    if ( iWidth && bHeadingSpace )
                        while ( iValue < iWidth-- )
                            *pOutput++ = ' ';
                    if ( iPrec && iPrec < iValue )
                        while ( iPrec-- )
                            *pOutput++ = *pValue++;
                    else
                        while ( *pValue )
                            *pOutput++ = *pValue++;
                    if ( iWidth && !bHeadingSpace )
                        while ( iValue < iWidth-- )
                            *pOutput++ = ' ';
                    state = SNORMAL;
                    break;
                }
            case 'p': // pointer
                {
                    void * pValue = va_arg ( ap, void * );
                    uint64_t uValue = uint64_t ( pValue );
                    UItoA ( &pOutput, uValue, 16, iWidth, iPrec, cFill );
                    state = SNORMAL;
                    break;
                }
            case 'x': // hex integer
            case 'd': // decimal integer
                {
                    DWORD uValue = va_arg ( ap, DWORD );
                    UItoA ( &pOutput, uValue, ( c=='x' ) ? 16 : 10, iWidth, iPrec, cFill );
                    state = SNORMAL;
                    break;
                }
            case 'l': // decimal int64
                {
                    int64_t iValue = va_arg ( ap, int64_t );
                    UItoA ( &pOutput, iValue, 10, iWidth, iPrec, cFill );
                    state = SNORMAL;
                    break;
                }
            default:
                state = SNORMAL;
                *pOutput++ = c;
        }
    }
    // final zero to EOL
    *pOutput++ = '\n';
    return pOutput - pBegin;
}
ログイン後にコピー

二进制1的个数

之前我曾写过一篇文章详解二进制数中1的个数,大家可以看看。

inline int sphBitCount ( DWORD n ){
    register DWORD tmp;
    tmp = n - ((n >> 1) & 033333333333) - ((n >> 2) & 011111111111);
    return ( (tmp + (tmp >> 3) ) & 030707070707) % 63;
}
ログイン後にコピー

整数二进制的位数

/// how much bits do we need for given int
inline int sphLog2 ( uint64_t uValue )
{
#if USE_WINDOWS
    DWORD uRes;
    if ( BitScanReverse ( &uRes, (DWORD)( uValue>>32 ) ) )
        return 33+uRes;
    BitScanReverse ( &uRes, DWORD(uValue) );
    return 1+uRes;
#elif __GNUC__ || __clang__
    if ( !uValue )
        return 0;
    return 64 - __builtin_clzl(uValue);
#else
    int iBits = 0;
    while ( uValue )
    {
        uValue >>= 1;
        iBits++;
    }
    return iBits;
#endif
}
ログイン後にコピー

模板 堆排序

这个堆排序写的太奇葩了,哎,不能说什么了。

/// generic accessor
template < typename T > struct SphAccessor_T{
    T & Key ( T * a ) const; //得到指针的值
    void CopyKey ( T * pMed, T * pVal ) const;
    void Swap ( T * a, T * b ) const;
    T * Add ( T * p, int i ) const;//第i个位置的指针
    int Sub ( T * b, T * a ) const;//指针偏移量
};
/// heap sort helper
// 自底向上进行堆排序
//pData 带排序数组
//iStart 开始位置
//iEnd 结束位置
//COMP 比较函数
//ACC 访问指针的类
template < typename T, typename U, typename V >
void sphSiftDown ( T * pData, int iStart, int iEnd, U COMP, V ACC ){
    for ( ;; ){
        int iChild = iStart*2+1;
        if ( iChild>iEnd )return;
        int iChild1 = iChild+1;
        if ( iChild1<=iEnd && COMP.IsLess ( ACC.Key ( ACC.Add ( pData, iChild ) ), ACC.Key ( ACC.Add ( pData, iChild1 ) ) ) )
            iChild = iChild1;
        if ( COMP.IsLess ( ACC.Key ( ACC.Add ( pData, iChild ) ), ACC.Key ( ACC.Add ( pData, iStart ) ) ) )
            return;
        ACC.Swap ( ACC.Add ( pData, iChild ), ACC.Add ( pData, iStart ) );
        iStart = iChild;
    }
}
/// heap sort
//奇葩的是先求出最大堆,然后反转,还边反转边维护堆。  
//最终是个最小堆。  
template < typename T, typename U, typename V >
void sphHeapSort ( T * pData, int iCount, U COMP, V ACC ){
    if ( !pData || iCount<=1 )
        return;
    // build a max-heap, so that the largest element is root
    for ( int iStart=( iCount-2 )>>1; iStart>=0; iStart-- )
        sphSiftDown ( pData, iStart, iCount-1, COMP, ACC );
    // now keep popping root into the end of array
    for ( int iEnd=iCount-1; iEnd>0; ){
        ACC.Swap ( pData, ACC.Add ( pData, iEnd ) );
        sphSiftDown ( pData, 0, --iEnd, COMP, ACC );
    }
}
ログイン後にコピー

快速排序

sphinx 的快速排序也很奇葩。
一般的快速排序是递归,sphinx使用栈模拟递归。
这样栈的大小大概就是 log(n) 了。
而且栈为空的时候共有 log(n) 次。
当数据特殊的时候,快排会退化为 n^2 的复杂度,这个时候,栈为空的几率变大了。
于是 sphinx 加了个修复, 当栈为空的次数大于 2.5 * log(n), 就是用上面那个奇葩的堆排序。
不过这个优化作用不大。

另外这个快排加了一个小优化:当需要排序的数量小于32时,使用插入排序。

template < typename T, typename U, typename V >
void sphSort ( T * pData, int iCount, U COMP, V ACC ){
    if ( iCount<2 )return;
    typedef T * P;
    // st0 and st1 are stacks with left and right bounds of array-part.
    // They allow us to avoid recursion in quicksort implementation.
    P st0[32], st1[32], a, b, i, j;
    typename V::MEDIAN_TYPE x;
    int k;
    const int SMALL_THRESH = 32;
    int iDepthLimit = sphLog2 ( iCount );
    iDepthLimit = ( ( iDepthLimit<<2 ) + iDepthLimit ) >> 1; // x2.5
    k = 1;
    st0[0] = pData;
    st1[0] = ACC.Add ( pData, iCount-1 );
    while ( k ){
        k--;
        i = a = st0[k];
        j = b = st1[k];
        // if quicksort fails on this data; switch to heapsort
        if ( !k ){
            if ( !--iDepthLimit ){
                sphHeapSort ( a, ACC.Sub ( b, a )+1, COMP, ACC );
                return;
            }
        }
        // for tiny arrays, switch to insertion sort
        int iLen = ACC.Sub ( b, a );
        if ( iLen<=SMALL_THRESH ){
            for ( i=ACC.Add ( a, 1 ); i<=b; i=ACC.Add ( i, 1 ) ){
                for ( j=i; j>a; ){
                    P j1 = ACC.Add ( j, -1 );
                    if ( COMP.IsLess ( ACC.Key(j1), ACC.Key(j) ) )
                        break;
                    ACC.Swap ( j, j1 );
                    j = j1;
                }
            }
            continue;
        }
        // ATTENTION! This copy can lead to memleaks if your CopyKey
        // copies something which is not freed by objects destructor.
        ACC.CopyKey ( &x, ACC.Add ( a, iLen/2 ) );
        while ( a<b ){
            while ( i<=j ){
                while ( COMP.IsLess ( ACC.Key(i), x ) )
                    i = ACC.Add ( i, 1 );
                while ( COMP.IsLess ( x, ACC.Key(j) ) )
                    j = ACC.Add ( j, -1 );
                if ( i<=j ){
                    ACC.Swap ( i, j );
                    i = ACC.Add ( i, 1 );
                    j = ACC.Add ( j, -1 );
                }
            }
            // Not so obvious optimization. We put smaller array-parts
            // to the top of stack. That reduces peak stack size.
            if ( ACC.Sub ( j, a )>=ACC.Sub ( b, i ) ){
                if ( a<j ) { st0[k] = a; st1[k] = j; k++; }
                a = i;
            } else{
                if ( i<b ) { st0[k] = i; st1[k] = b; k++; }
                b = j;
            }
        }
    }
}
ログイン後にコピー

二分查找

sphinx 的这个二分查找没有问题,但是和我们平常的二分查找还是有点不同的。
它的左右边界都是开放的,即(a,b).

/// generic binary search
template < typename T, typename U, typename PRED >
T * sphBinarySearch ( T * pStart, T * pEnd, const PRED & tPred, U tRef ){
    if ( tPred(*pStart)==tRef )return pStart;
    if ( tPred(*pEnd)==tRef )return pEnd;
    while ( pEnd-pStart>1 ){
        if ( tRef<tPred(*pStart) || tPred(*pEnd)<tRef )break;
        T * pMid = pStart + (pEnd-pStart)/2;
        if ( tRef==tPred(*pMid) )return pMid;
        if ( tRef<tPred(*pMid) )pEnd = pMid;
        else pStart = pMid;
    }
    return NULL;
}
ログイン後にコピー

数组去重

要想去重,首先需要排序,所以这里假设容器是已经排完序的了。
然后假设 iDst 的上一个就是目前比较的值。
如果和上一个相等,则iSrc后移。
如果和上一个不相等,则找到一个新的值,将iDst位置置为新值,个数加1即可。

/// generic uniq
template < typename T, typename T_COUNTER >
T_COUNTER sphUniq ( T * pData, T_COUNTER iCount ){
    if ( !iCount )return 0;
    T_COUNTER iSrc = 1, iDst = 1;
    while ( iSrc<iCount ){
        if ( pData[iDst-1]==pData[iSrc] )iSrc++;
        else pData[iDst++] = pData[iSrc++];
    }
    return iDst;
}
ログイン後にコピー
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

Java 関数比較を使用して複雑なデータ構造を比較する Java 関数比較を使用して複雑なデータ構造を比較する Apr 19, 2024 pm 10:24 PM

Java で複雑なデータ構造を使用する場合、Comparator を使用して柔軟な比較メカニズムを提供します。具体的な手順には、コンパレータ クラスの定義、比較ロジックを定義するための比較メソッドの書き換えが含まれます。コンパレータインスタンスを作成します。 Collections.sort メソッドを使用して、コレクションとコンパレータのインスタンスを渡します。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

Javaのデータ構造とアルゴリズム: 詳細な説明 Javaのデータ構造とアルゴリズム: 詳細な説明 May 08, 2024 pm 10:12 PM

データ構造とアルゴリズムは Java 開発の基礎です。この記事では、Java の主要なデータ構造 (配列、リンク リスト、ツリーなど) とアルゴリズム (並べ替え、検索、グラフ アルゴリズムなど) について詳しく説明します。これらの構造は、スコアを保存するための配列、買い物リストを管理するためのリンク リスト、再帰を実装するためのスタック、スレッドを同期するためのキュー、高速検索と認証のためのツリーとハッシュ テーブルの使用など、実際の例を通じて説明されています。これらの概念を理解すると、効率的で保守しやすい Java コードを作成できるようになります。

PHP データ構造: AVL ツリーのバランス、効率的で秩序あるデータ構造の維持 PHP データ構造: AVL ツリーのバランス、効率的で秩序あるデータ構造の維持 Jun 03, 2024 am 09:58 AM

AVL ツリーは、高速かつ効率的なデータ操作を保証するバランスのとれた二分探索ツリーです。バランスを達成するために、左回転と右回転の操作を実行し、バランスに反するサブツリーを調整します。 AVL ツリーは高さバランシングを利用して、ツリーの高さがノード数に対して常に小さくなるようにすることで、対数時間計算量 (O(logn)) の検索操作を実現し、大規模なデータ セットでもデータ構造の効率を維持します。

画期的な CVM アルゴリズムが 40 年以上の計数の問題を解決します。コンピューター科学者がコインを投げて「ハムレット」を表す固有の単語を割り出す 画期的な CVM アルゴリズムが 40 年以上の計数の問題を解決します。コンピューター科学者がコインを投げて「ハムレット」を表す固有の単語を割り出す Jun 07, 2024 pm 03:44 PM

数を数えるのは簡単そうに思えますが、実際にやってみるととても難しいです。あなたが野生動物の個体数調査を実施するために自然のままの熱帯雨林に運ばれたと想像してください。動物を見かけたら必ず写真を撮りましょう。デジタル カメラでは追跡された動物の総数のみが記録されますが、固有の動物の数に興味がありますが、統計はありません。では、このユニークな動物群にアクセスする最善の方法は何でしょうか?この時点で、今すぐ数え始めて、最後に写真から各新種をリストと比較すると言わなければなりません。ただし、この一般的なカウント方法は、数十億エントリに達する情報量には適さない場合があります。インド統計研究所、UNL、およびシンガポール国立大学のコンピューター科学者は、新しいアルゴリズムである CVM を提案しました。長いリスト内のさまざまな項目の計算を近似できます。

グローバルグラフ強化に基づくニュース推奨アルゴリズム グローバルグラフ強化に基づくニュース推奨アルゴリズム Apr 08, 2024 pm 09:16 PM

著者 | Wang Hao によるレビュー | Chonglou ニュース アプリは、人々が日常生活で情報ソースを入手する重要な方法です。 2010年頃、海外ニュースアプリの人気はZiteやFlipboardなどがあり、国内ニュースアプリの人気は主に4大ポータルでした。 Toutiaoに代表される新時代のニュースレコメンド商品の人気により、ニュースアプリは新時代を迎えました。テクノロジー企業に関しては、どの企業であっても、高度なニュース推奨アルゴリズム技術を習得していれば、基本的に技術レベルでの主導権と発言権を握ることになる。今日は、RecSys2023 Best Long Paper Nomination Award の論文、GoingBeyondLocal:GlobalGraph-EnhancedP を見てみましょう。

See all articles